citizen data science muuttaa julkishallintoa
Post on 11-Feb-2017
521 Views
Preview:
TRANSCRIPT
Alkumotto:Mieli kielen sanoittaa, kokemus kielenkannan kirvoittaa
Virpi Hottihttps://fi.linkedin.com/in/virpihotti
Citizen data science muuttaa julkishallintoa
Agenda• Tieto, tiede, motivaatio ja citizen
data science• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS179
• Kaksikätisyydellä selkeyttäjohtamiseen
• Näkemykset (insights) tulevat• Miten citizen data scientist
pääsee konkreettisestieteenpäin?
”Näkemyksellinen citizen data sciencemuuttaa julkishallintoa eli citizendatatieteilijät osaavat navigoidaanalytiikka- ja indikaattorizoossa sekämuodostavat tai muodostuttavatliiketoimintamalleja tukeviakäyttökelpoisia näkemyksiä”
Agenda• Tieto, tiede, motivaatio ja
citizen data science• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS179
• Kaksikätisyydellä selkeyttäjohtamiseen
• Näkemykset (insights) tulevat• Miten citizen data scientist
pääsee konkreettisestieteenpäin?
Google-kuvahaku: JasonGoto
Tieto• ”Suomen kielessä tiedolla voidaan
tarkoittaa dataa, informaatiota taioppimisen ja kokemuksen kauttamuodostuvaa tietämystä” (JHS 179)
• “Knowledge is the theoreticalparadigm, the what to do andthe why. Skill is the how to do. Anddesire is the motivation, the want todo. In order to make something ahabit in our lives, we have to have allthree.” (The 7 Habits of Highly EffectivePeople: Powerful Lessons in Personal Change)
Kuvan lähde: https://www.pursuant.com/blog/redefining-fundraising-data/
Google-kuvahaku: JasonGoto.
Tiede
• “Science in its original sense is aword for a type of knowledge . . . Inparticular it is one of the types ofknowledge which people cancommunicate to each other andshare”(https://en.wikipedia.org/wiki/Science)
• Ilkka Niiniluodon mukaanfilosofiassa eli viisaustieteeteessäon jotain pysyvää eli ”Ainakin hyvätargumentit ja hyvät käsitteet, jakyllä se tietokin pikkuhiljaakarttuu” (HS, 12.3.2016)
Google-kuvahaku: JasonGoto.
Motivaatio
• 16 perusmotiivia Steven Reissinmukaan: valta, riippumattomuus,uteliaisuus, hyväksyntä, järjestys,säästäminen/kerääminen, kunnia,idealismi, sosiaaliset kontaktit, perhe,status, kosto/voittaminen,esteettisyys, syöminen, ruumiillinenaktiivisuus, rauhallisuus/mielenrauha
• Suomessa 11 % on sitoutuneitatyöhönsä, 13 % pistää kapuloitarattaisiin ja sabotoi tavoitteisiinpääsyä (MMA 2/2016)
Lähde: http://thumbs.dreamstime.com/z/maslow-pyramid-theory-needs-21205277.jpg
Kuvan lähde: https://www.gartner.com/newsroom/id/3114217
Hype CycleReport ofEmergingtechnologies(Gartner2015) – BigData putosija tilallesiihenliittyviä“teknologioita” kutenCitizen DataScience
Gartnerin määritelmät datatieteilijöille
• Citizen data scientists are “people on thebusiness side that may have somedata skills, possibly from a math oreven social science degree—andputting them to workexploring and analyzing data”
• “The data scientist role is critical fororganizations looking to extract insightfrom information assets for “big data”initiatives and requires a broadcombination of skills that may be fulfilledbetter as a team, for example:Collaboration and team work is requiredfor working with business stakeholders tounderstand business issues. Analyticaland decision modeling skills are requiredfor discovering relationships withindata and detecting patterns. Datamanagement skills are required to buildthe relevant dataset used forthe analysis.”
Lähteet: http://www.kdnuggets.com/2015/08/gartner-2015-hype-cycle-big-data-is-out-machine-learning-is-in.html jahttps://www.gartner.com/it-glossary/data-scientist/
Datan auki avaaminen (eli analytiikka) on ensisijaisestiyhteenvetojen tekemistä datajoukon ominaisuuksista
Kuvan lähde: Hotti V., Gain U., Lintula H., Puumalainen A., Salomaa H.: Construction of business-driven capta processing. The3rd Virtual International Conference on Advanced Research in Scientific Areas (ARSA-2014) Slovakia, December 1 - 5, 2014.
“Data exploration isthe first step in dataanalysis andtypically involvessummarizing themain characteristicsof a dataset.”http://searchbusinessanalytics.techtarget.com/definition/data-exploration
Ja Pareton periaate pätee täälläkin…
Lähde: http://community.lithium.com/t5/Science-of-Social-blog/Big-Data-Reduction-1-Descriptive-Analytics/ba-p/77766
Citizen data scientist on digitaalinen isännöitsijä?
Lähde 25.3.2016: http://www.tivi.fi/Kaikki_uutiset/ai-mukamas-kuuma-it-duuni-edelleen-pelkka-digitaalinen-talonmies-6535738
Lähde: Advanced Business Analytics Course Notes, SAS Institute.
Citizen data science kulmakivet• Yksilön/yhteisön ymmärryksen lisääntyessä
kognitiosta siirrytään toimintaan. Setarkoittaa mm. (liike)toiminnan kannaltamerkityksellisien, dataan perustuvienratkaisuehdotuksien tekemistä ja niidentoteuttamista
• Analytiikka kuuluu kaikille ja sen tulee ollahelposti lähestyttävää (approachable)
• Data-analytiikan avulla tuotetaan eritoimialoilla toimiville organisaatioillekäyttökelpoisia/käytännönläheisiänäkemyksiä (actionable insights)
• Monimuotoisia datajoukkoja kuvaillaan jayhdistetään sekä visualisoidaan sekähyödynnetään ohjaamatonta (unsupervised)tai ohjattua (supervised) koneoppimista(machine learning), johon liittyy myössyväoppiminen (deep learning)
• Koko ajan on mietittävä, mitä arvoa datalla onja kenelle sekä millä viiveellä (millisekunneistavuosiin)
Data
Data models,advancedanalytics and BItools, etc.
Business
Businessmodels, key
questions,indicators, etc
People Decision models,experiences, etc.
Liiketoiminta- ja/tai toimialaosaamista tarvitaantulosten tulkinnassa (paikkaansapitävyys jaoikeellisuus)
Lähde: https://en.wikipedia.org/wiki/Accuracy_and_precisionLähde: http://www.mathsisfun.com/accuracy-precision.html
Abreu “Grindaa ja flowaa” ja datatieteteilijät“Blendaa ja advaa” . . .
Source:http://pages.alteryx.com/rs/alteryx/images/Data%20Blending%20For%20Dummies%20by%20Wiley%20-%20from%20Alteryx.pdf
“can data scientists be replaced bya general data science machine? Anumber of vendors are betting bigthat it can. Managers across theworld are hoping they are right.”(https://www.linkedin.com/pulse/big-data-science-some-reflections-compensation-levels-harry-powell)
=>Citizen data scientist ei olekorvattavissa, koskatoimialaosaaaminen ja tulostenpaikaansapitävyys vaatiitoistaiseksi ”ihmistulkit”
Agenda• Tieto, tiede, motivaatio ja citizen
data science• Kokonaisarkkitehtuuri ja
tiedolla johtaminen sekäuudistettu JHS 179
• Kaksikätisyydellä selkeyttäjohtamiseen
• Näkemykset (insights) tulevat• Miten citizen data scientist
pääsee konkreettisestieteenpäin?
Kohti kansalaiskeskeistä palveluiden kehittämistä – mitenyhdistää tiedolla johtaminen ja kokonaisarkkitehtuurityö?”
Lähde: Ritvanen H., Sinipuro J., Hotti V.:http://ojs.tsv.fi/index.php/stty/article/view/45259
Uudistettu JHS 179 huomioi liiketoimintamallit jakyvykkyydet • ”Kyvykkyydet muodostuvat ihmisistä ja
osaamisesta, liiketoimintamalleista ja niitätoteuttavista prosesseista sekä tiedoista jatietojärjestelmistä. Kyvykkyyksien ja niihin liittyvänsuorituskyvyn myötä syntyy toiminnankokonaiskyvykkyys toimia suunnitellullaliiketoimintamallilla.”
• ”Useista erilaisista palveluista ja eri asiakasryhmistäjohtuen organisaatiolla voi ollasamanaikaisesti käytössään useita eriliiketoimintamalleja ja niiden edellyttämiäkyvykkyyksiä.”
• ”Kyky toimia tarkoituksenmukaisella tavalla tietyllä osa-alueella, ja hyödyntää osaamistaan sekä resurssejaan, jottatavoitteet saavutetaan”
• ”Sekä yksityisten että julkisen hallinnon organisaatioidenkyvykkyys koostuu kolmesta osakokonaisuudesta, joita ovattoimintamallit ja prosessit, henkilöstö ja osaaminen sekätiedot ja järjestelmät”
JHS 179 ja kyvykkyyksien kuvaus
Tarvitaan jatkuvaa peilausta strategisiin tavoitteisiin –toimiiko JHS 179 ”ketteränä” työkaluna?
• Kokonaisarkkitehtuurikuvauksetovat pääasiassa bottom-up-kuvauksia kuten Six Sigmassa
• ”some of the organizations thatbecame poster boys for SixSigma have indeed securedmouthwatering cost savingsfrom their effort, they havesimultaneously been very poorperformers on the stock marketand have been recognised fortheir strategic failures”
Yhteentoimivuutta edesauttavat kansalliset palvelutkuten KAPA (eli X-road) helpottavat tietovarantojenhyödyntämistä
• Aika alkaa ollaotollinen erilaistentietopalvelujenrakentamiseen elieri tietovarantojentietojen yhdistelylläsaadaan aikaankäyttökelpoisianäkemyksiä
http://www.tivi.fi/Kaikki_uutiset/valtio-rakentaa-it-nyrkkia-vaestorekisterikeskukseen-6541723
Agenda• Tieto, tiede, motivaatio ja citizen
data science• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS179
• Kaksikätisyydellä selkeyttäjohtamiseen
• Näkemykset (insights) tulevat• Miten citizen data scientist
pääsee konkreettisestieteenpäin?
Exploration ja exploitation ovat aktiviteettejä, jotkavoidaan liittää organisaation eri funktioihin• March (1991) wrote as follows:
• Exploration “includes things captured by terms such assearch [etsiminen], variation [validointi], risk taking[riskinottaminen], experimentation [kokeileminen],play, flexibility [joustavuus], discovery, innovation”
• Exploitation “includes such things as refinement[uudelleenmääritteleminen], choice, production,efficiency [tehokkuus], selection, implementation,execution”
• “Previous ambidexterity studies have shown thatexploration is linked to growth whereasexploitation is linked to profits” (Bøe-Lillegraven went, 2014)
• Bøe-Lillegraven (2014) went “beyond thesearguments, furthering our understanding of theinteraction mechanisms between six dimensions ofthe explore/exploit value chains: resourceallocation, cost structure, value proposition,market performance, revenues, and profits”
Lähde:http://vserver1.cscs.lsa.umich.edu/~pjlamber/Complexity%20Course_files/exploration_exploitation.pdf
Haetaan ”tasapainoa”Exploitation
ImproveMainly own data
BI (businessintelligence)Slow learners
…
ExplorationInvent
Both open andown data
AA (advancedanalytics)
AI (artificialintelligence)Fast learners
… Lähde: https://archive.feedblitz.com/857009/~4530973
Agenda• Tieto, tiede, motivaatio ja citizen
data science• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS179
• Kaksikätisyydellä selkeyttäjohtamiseen
• Näkemykset (insights) tulevat• Miten citizen data scientist pääsee
konkreettisesti eteenpäin?
IDOs are coming
Source: http://www.kdnuggets.com/2016/01/businesses-need-one-million-data-scientists-2018.html
Näkemyksiä palveluna
Esimerkiksi IBM WatsoninPersonal Insight, jokatuottaaaurinkopyrskäytyksiä(sunbursts), jotka arvioivatpersoonallisuuden, tarpeetja arvot, joita voidaankäyttää esimerkiksisidosryhmientoimenpidesuunnittelussakuten milloin kannattaakontaktoida
Lähde: https://watson-pi-demo.mybluemix.net/sunburst
• Kokeillaan tekstin arviointiahttps://watson-pi-demo.mybluemix.net/?cm_mc_uid=40460998702314578514193&cm_mc_sid_50200000=1458388845
• Teksti on seuraava (Hotti 29.2.2016: Question-based and pattern-driven issues reflect the realization of the ability to compete):
When we will categorize contents the triggers are formed usingoperators. The operators are used when the sentiments (i.e.,positive, negative or neutral) are recognized, for example, fromtweets. Furthermore, it is possible to compare sentences to have analgorithm scoring their similarity.
Nowadays, analytics tools support citizen data scientist, for example,hiding the names of techniques (e,g., algorithms) and instead ofstatistical issues the business-related concepts are used. Forexample, data contain data items the role of which (e.g., input ortarget) can vary. However, data modeling level or type (e.g., nominal,ordinal and continuous/interval) affects for patterns and models.For example, nominal data (e.g., names) can be counted, ordinaldata (e.g., ratings) can be counted and ordered, and continuous data(e.g., amounts) can be counted, ordered and measured.
When we explore data then we try to find out patterns or models.The exploring is used of instead of the analytics which refers “toextracting useful business patterns or mathematical decision modelsfrom preprocessed data set”. If there is no real target to steer theanalyzing process, then the main aim is to describe patterns (e.g.,associations or clusters). If there is the real target, then the main aimis to build models (e.g., networks, regressions and trees).
Valtiovarainministeriö“The Ministry of Finance is led by the Minister of Finance. TheGovernment often also has another minister, whose field ofresponsibility includes a part of the functions of the Ministry ofFinance. The division of the ministers' duties is agreed when theGovernment is formed. The most senior civil servant in theMinistry of Finance is the Permanent Secretary. The PermanentSecretary is assisted by the Permanent Under-Secretary, theDirector of Administrative Governance and Development as wellas the Economic Policy Coordinator. There are approximately 380people working in the Ministry.
The Ministry includes the Economics, Budget, Tax and FinancialMarkets Departments as well as the Department for LocalGovernment and Regional Administration, the Public Sector ICToperational unit and the Personnel and Governance PolicyDepartment, which also acts as the Office for the Government asEmployer. The Administrative Governance and Development isresponsible for internal administration of the Ministry; it alsoprovides communication services. The Secretariat forInternational Affairs operates directly under the management. Inaddition, the Government financial controller's function operateswithin the Ministry.” http://vm.fi/en/management-and-organisation
Source: Minelli Michael, Chambers Michele,Dhiraj Ambiga, (2013), Big Data, Big Analytics:Emerging Business Intelligence and AnalyticTrends for Today's Businesses, pp.13-14
Ei enää syitä, vaan näkemyksiä!?!• Kirjassa Thinking, Fast and Slow nobelisti Kahnemann
toteaa ”we easily think associatively, metaphorically,and causally. However, it is difficult to thinkstatistically”, niin tarvitaan tutkimusta, jossa tehdäänläpinäkyväksi organisaatioiden intuition ja faktoihinperustuva päätöksenteko.
• Pelkät korrelaatiot eivät riitä, vaan tarvitaan asiayhteys(context), joka antaa datalle merkityksen ja Data-ism-kirjan kirjoittaja Steve Lohrin (2015, 109) mukaanassosiaatiot ovat korrelaatioiden sijaan askel kohtitietämystä (knowledge) eli kohti käytännöllisiäoivalluksia.
• Syiden selvittäminen eli miksi-kysymykseenvastaaminen kyseenalaistetaan Viktor Mayer-Schönbergerin ja Kenneth Cukierin sanoin ”The ideal ofidentifying causal mechanisms is a self-congratulatoryillusion; big data overturns this” (Lohr 2015, 112) –tämän asian ymmärtäminen vaatinee jopa monitieteistätarkastelua, sillä Lohr viittaa asiayhteydessä myösnobelisti Kahnemaniin ja siihen, että miksi-kysymykseenvastaus tukee intuitiivista päätöksentekoa, eikähyödynnä dataa suorituksen johtamisessa organisaationeri funktioissa. Lähde: Steve LaValle, Eric Lesser, Rebecca Shockley, Michael S. Hopkins and
Nina Kruschwitz: Big Data, Analytics and the Path From Insights to Value. MITSLOAN MANAGEMENT REVIEW, 2011.
Agenda• Tieto, tiede, motivaatio ja citizen
data science• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS179
• Kaksikätisyydellä selkeyttäjohtamiseen
• Näkemykset (insights) tulevat• Miten citizen data scientist
pääsee konkreettisestieteenpäin?
Businessmodels Insights Exploitation Exploration Stakeholders
Datan hyödyntämisen perusfunktiot
Raportointi Ennustaminen jaennakointi sekä
ohjaaminen
Raportoinnin lisäksi tulevaisuutta ennustetaan(forecasting) olemassa olevan datan perusteella taiennakoidaan (predict) datasta valikoitujenominaispiirteiden (attributes, characteristics, features,items, variables) perusteella. Lisäksi halutaan ohjatatulevaisuuden toimintaa.
Dataa hyödynnetään, jottaorganisaation periaatteetkonkretisoituvat ja osataanvalita tarvittava dataanalysoitavaksi
Kuvan lähde: Gain ja Hotti (15.4.2016) Exploitation and exploration underpin business and insights underpin business analytics
Avainkysymysten avulla (key questions) voidaankonkretisoida, mitä informaatiota halutaan saada selville
Kysymys Vastausaihio Vastaus-tyyppi
Vastaus-tiheys
Vertailu-arvo
Data-lähteet
Paljonkotuotammetaloudellistatulosta?
Nettotulos = kokonaistulot -kokonaiskulut (mukaan lukienkäyttökustannukset,rahoituskulut ja verot)
raha kk ERP
Missä määrinolemme pystyneetpitämäänhankkimammeasiakkaat?
Asiakkuuden pysyvyysaste =(asiakkaiden määrä kaudenalussa / niiden asiakkaidenmäärä, jotka ovat asiakkaitamyös kauden lopussa) * 100
% kk CRM
Yksittäisentyöntekijänsuunnittele-mattomienpoissaolojenkerroin?
Absenteeism Bradford factor =suunnittelemattomienpoissaolojen päivät *(suunnittelemattomienpoissaolojen lkm)
numero kk 12 HRM
Kaksikätisyyttä ja liiketoimintamallin rakenneosiasekä avainkysymyksiä voidaan ristiintaulukoida
• keskeiset kumppanit – Mitkä ovat motiivitkumppanuuksille?
• keskeiset aktiviteetit – Mitä aktiviteettejä arvolupausvaatii?
• arvolupaukset (ml. tuotteet ja palvelut) - Mitäasiakastarpeita (customer needs) tyydytetään ja millä?
• asiakassuhteet – Mitä suhteita asiakas meiltä odottaa?
• asiakassegmentit – Mille yhteyskuntaluokille (classes)luomme arvoa?
• keskeiset resurssit – Mitä resursseja arvolupaus vaatii?
• kustannusrakenne – Kiinteät ja muuttuvatkustannukset?
• kanavat – Mitä kanavia asiakkaat haluavat käyttää?
• tulovirrat - Mistä asiakkaat ovat valmiita maksamaan?
Analytiikka
Expl
oita
tion
Expl
orat
ion
Kum
ppan
it
Aktiv
iteet
it
Arvo
lupa
ukse
t
Asia
kass
uhte
et
Asia
kass
egm
entit
Resu
rssi
t
Kust
annu
kset
Kana
vat
Tulo
virr
at
Kassavirta x x xKysynnän ennakointi(predictive sales)
x x x x
Kapasiteetin käyttö(capacity utilization)
x x x x x x x x x x
Tyydyttämättömättarpeet (unmet needs)
x x x x
Organisaation kulttuuri x x x x x x x xSosiaalinen taiyhteiskunnallinenvastuu
x x x x x x x x
Kokonaisarkkitehtuurikuvauksia voidaanhyödyntää mittarimäärittelyssä
• Kokoa periaatetason kuvaukset
• Kokoa näkökulmia yhdistävät matriisit
• Jollei liiketoimintamallia ole, niin hahmotteleliiketoimintamalli periaatetason kuvauksethuomioiden
• Mieti yksi tavoite, jota haluat seurata
• Mieti, miten tavoitteen seurantamittarillelasketaan arvo
• Mieti, mitä dataa tarvitset seurantamittarin arvonlaskemiseksi
• Tunnista datalähteet, joissa on tarvittava datasijaitsee
• Tavalla tai toiselle hanki tarvittavat datajoukot
• Yhdistä datajoukot muistinvaraisesti ja määrittelevalitulla työkalulla seurantamittari
Esimerkiksi excelin lisäominaisuuksilla voiharjoitella datan manipulointia ja analysointia
• Valitaan 1 tai useampi datajoukko
• Kuvaillaan datajoukot
• Yhdistetään datajoukot muistinvaraisesti(lisäominaisuudet Power Query + Power Pivot)
• Visualisoidaan yhdistelyn tuloksia eri tavoin kutenpivot-taulut
• Jos datajoukoissa on aikaleimoja, niin ennustetaan(forecasting) jonkun muuttujan arvojatulevaisuudessa
• Jos käytössä on tieto sekä käytettävistä resursseistaettä suoritevaatimukset, niin muodostetaanoptimointimalleja (lisäominaisuus Ratkaisin)
• Jos käytössä on esimerkiksi data mining -lisäominaisuuksia, niin muodostetaan mallinteitaja/tai malleja
• Muistinvaraisen tietomallin voi siirtää Power BI –työkaluun ja jatkaa visualisoinnin harjoittelua eritavoin kuten gauget ja treemapit
Businessmodels Insights Exploitation Exploration Stakeholders
Näkemyksellinen citizen data science muuttaa julkishallintoa elicitizen datatieteilijät osaavat navigoida analytiikka- jaindikaattorizoossa sekä muodostavat tai muodostuttavatliiketoimintamalleja tukevia käyttökelpoisia näkemyksiä
Canvakset esiintyvät nykyisinliiketoimintamalleissa jatyökaluissa. Rakenneosat(building blocks)liiketoimintamalleissa jakognitiivisten sovellustenrakenneosina – “the cognitivecomputing features allow usto form innovative businessmodels and they reduce thenumber of needed analytics”(Gain ja Hotti (15.4.2016)Exploitation and explorationunderpin business andinsights underpin businessanalytics)
Loppumotto:Loista lainavaloilla kunnes omat valot syttyvät
Virpi Hottihttps://fi.linkedin.com/in/virpihotti
Esityksen kuulijoita kiittäen
When we will categorize contents the triggers are formed using operators. Theoperators are used when the sentiments (i.e., positive, negative or neutral) arerecognized, for example, from tweets. Furthermore, it is possible to comparesentences to have an algorithm scoring their similarity.Nowadays, analytics tools support citizen data scientist, for example, hiding thenames of techniques (e,g., algorithms) and instead of statistical issues the business-related concepts are used. For example, data contain data items the role of which(e.g., input or target) can vary. However, data modeling level or type (e.g., nominal,ordinal and continuous/interval) affects for patterns and models. For example,nominal data (e.g., names) can be counted, ordinal data (e.g., ratings) can becounted and ordered, and continuous data (e.g., amounts) can be counted, orderedand measured.When we explore data then we try to find out patterns or models. The exploring isused of instead of the analytics which refers “to extracting useful business patternsor mathematical decision models from preprocessed data set”. If there is no realtarget to steer the analyzing process, then the main aim is to describe patterns (e.g.,associations or clusters). If there is the real target, then the main aim is to buildmodels (e.g., networks, regressions and trees)
top related