praktilised avaandmed

35
Praktilised avaandmed Andres Kütt Riigi Infosüsteemi arhitekt 18.09.2014

Upload: andres-kuett

Post on 11-Jul-2015

79 views

Category:

Software


5 download

TRANSCRIPT

Page 1: Praktilised Avaandmed

Praktilised avaandmed

Andres Kütt Riigi Infosüsteemi arhitekt !18.09.2014

Page 2: Praktilised Avaandmed

Praktiline mõtlemine, mitte retseptid !

!

Parimad tehnilised lahendused muutuvad

kiiresti ja sõltuvad palju konkreetsest probleemist

Page 3: Praktilised Avaandmed

Täna kavas

" Miks avaandmed ja miks mitte? " Kuidas mõelda avaandmetest organisatsiooni

kontekstis? " Avaandmete ärilised probleemid " Avaandmete riskid " Tehnilised küsimused

Page 4: Praktilised Avaandmed

Sissejuhatus !

!

Page 5: Praktilised Avaandmed

Avaandmed on avalikult, ilma finantskohustusi võtmata, kätte saadavad

andmed !

!

Päris avatud andmeid ei ole, finantsbarjääri

valik definitsiooniks on kunstlik

Page 6: Praktilised Avaandmed

Miks avaandmed?

" Innovatsioon " Platvormistrateegia

" Andmete ja taristuga tegelemine on ärimudel " Juriidilised põhjused

" Seadusandlus kuid ka litsentsitingimused ja lepingud " Organisatsioonikultuur

" Nii selle manifestatsioon kui muutmise vahend " Lõppkasutaja soov " Avalikussuhted, korporatiivne vastutus

Page 7: Praktilised Avaandmed

Miks mitte avaandmed?

" Kõrge alternatiivkulu " Võrreldes muude omaniku hüve suurendamise viisidega

" Organisatsioonikultuur " Juriidilised põhjused

" Seadusandlus kuid ka litsentsitingimused ja lepingud " Organisatsiooniline inerts

" Suured organisatsioonid muutuvad aeglaselt " Riskid ja kohustused ei kaalu üles hüve

Page 8: Praktilised Avaandmed

Avaandmed ja organisatsioon !

!

Avaandmed ei ole vaid tehniline probleem, nad puudutavad organisatsiooni eri tahke

Page 9: Praktilised Avaandmed

Kõigepealt sõnasta eesmärk !

!

Miks te üldse avaandmetega tegelete?

Page 10: Praktilised Avaandmed

Organisatsiooni struktuur

Äri ja juriidika

Organisatsioon ja protsessid

Funktsionaalsed komponendid

Tehnilised lahendused

Page 11: Praktilised Avaandmed

Avaandmeid ümbritsevad jõud

Organisats

iooni

soovid

Turu vajadus

Org

an

isa

tsio

on

i

ime

ku

s j

a

pii

ran

gu

d

Ava-andmed

Page 12: Praktilised Avaandmed

Organisatsiooni kui terviku võimekus

" Kolm kirjeldatud jõudu toimivad kõigil tasandeil " Organisatsioonil võib olla äriline soov andmeid avada

kuid seda soovi võib piirata tehniline võimekus " Organisatsiooni võimekus on summa tema

võimekusest igal tasandil " On oluline hinnata, kas eesmärgi saavutamine

on reaalne " Kui ei, tuleb leida viisid võimekuse kasvatamiseks või

muuta eesmärki

Page 13: Praktilised Avaandmed

Avaandmed kui äriline probleem !

!

Page 14: Praktilised Avaandmed

Avaandmed on vitamiin, mitte valuvaigisti !

!

Tehnilises mõttes on tegu

madala signaali-müra suhtega

Page 15: Praktilised Avaandmed

Võimekus ja vajadus on nagu kana ja muna !

!

Me ei tea, mida me vajame, kuni me ei tea, mis teil on. Me ei saa teile kõike näidata,

öelge, mida teil vaja on

Page 16: Praktilised Avaandmed

Kolm avaandmete probleemi

" Avaandmed on ettevõttele pikaajaline kohustus " Eriti linkandmete korral

" Uued sõltuvused arenduses " Me ei saa muuta andmestruktuure ja äriloogikat

arvestamata avaandmete kasutajatega " Iga muutus meie süsteemis võib tähendada muutust

andmete kasutajate süsteemides " Uued sõltuvused halduses

" Tehes andmed kättesaadavaks lubame, et need on kättesaadavad ka tulevikus

Page 17: Praktilised Avaandmed

Kolm viisi andmeid avada

" Varjatud " Iga internetis olev andmeühik on sisult avalikult

kasutatavad andmed " Tavalised avaandmed

" Avalikud, dokumenteeritud ja stabiilse struktuuri ning semantikaga andmed

" Rohelise Raamatu subjekt " Piiratud avaandmed

" Andmed on avalikud ja tasuta, kuid kasutamiseks eeldatakse teatud barjääride ületamist (Google mudel)

Page 18: Praktilised Avaandmed

Varjatud avaandmed

" Kogu avalik info on masinloetav " Ja seda ka kasutatakse " Nii teie kahjuks kui kasuks

" Kasutusega ei ole mõistlik tehniliselt võidelda " Teise poole ressursid on liiga suured " Tuleb toetuda millelegi muule (näiteks juriidika)

" Vähegi tõsise huvi korral liikuge klassikalistele avaandmetele

Page 19: Praktilised Avaandmed

Tavapärased avaandmed

" Info on selgesõnaliselt kättesaadavaks tehtud " Koos põhjaliku dokumentatsiooniga " Oluline on stabiilne struktuur

" Semantika on oluline " Mida tähendab tühi väli? " Mida kirjutatakse välismaalase isikukoodi väljale?

" Kasu saamine eeldab suhtlust " Soovitavalt kahepoolset " “Meie server ei ole pühapäeval kättesaadav” " “Mida tähendab tühi isikukoodiväli?”

Page 20: Praktilised Avaandmed

Piiratud avaandmed

" Andmed on avalikud, kuid juurdepääsul on kunstlikud barjäärid " Näiteks vajadus registreeruda

" Juurdepääsul on alati piirangud " Kasvõi kasutatav tehnoloogia aga ka info teenuse

olemasolust " Kasulik andmete pakkujale

" Saab kehtestada ja jõustada kasutustingimusi " Tekib konkreetne kasutajate kogukond

Page 21: Praktilised Avaandmed

Avaandmed kui riskiprobleem !

!

Page 22: Praktilised Avaandmed

Isikuandmete kaitse

" Isikuandmeid ei saa päriselt puhastada " Täielikult isikuandmetest puhastatud info on ka

täielikult kasutu (matemaatika!) " Alati on küsimus mõistlikus riskis

" Eesti väiksuse probleem " Kui keskmistatakse ühte inimest, siis ei ole privaatsus

tagatud " Triangulatsiooni probleem

" Andmeid võib teiste allikate abil uuesti isikustada

Page 23: Praktilised Avaandmed

Operatiivsed riskid

" Piiranguteta avalikke andmeid ka kasutatakse piiranguteta " Kui tihti ja kui palju andmeid küsitakse, ei ole teada " Eriti ebameeldivad on järsk kasv koormuses

" Oluline on monitooring " Eesmärgiks teiste klientide kaitsmine üksiku valesti

käituva kliendi eest " Kuidas eristada pahatahtlikkust rumalusest?

" Kuidas seejärel pahatahtlik agent andmetest eemal hoida?

Page 24: Praktilised Avaandmed

Andmeriskid

" Allika mürgitamine " Ründaja muudab pakutavaid andmeid talle sobival viisil " Tuvastamine keeruline, mõju potentsiaalselt suur " Konkurendi telefoninumbri asendamine enda omaga

avalikus andmestikus, näiteks " Semantika riskid

" Pakutav andmestik on tollides ja kasutaja eeldab millimeetreid

Page 25: Praktilised Avaandmed

Null-kasutuse risk

" Kuup on n-mõõtmeline agregatsioon andmetelt " Oluline andmete puhastamise ning analüütika vahend " Exceli pivot table ainult et suur " Lihtne määratleda, kallis arvutada

" Kuup on lõplik " Kuubist saab ainult need koondid, mis on sinna sisse

kirjutatud " Isegi väike eksimus kuubi definitsioonis võib

andmed lõppkasutajale kasutuks muuta

Page 26: Praktilised Avaandmed

Avaandmed kui tehniline probleem !

!

Page 27: Praktilised Avaandmed

Kuidas andmetele ligi saab? !

!

Väga olulise mõjuga valik nii lahenduse kulu kui võimaliku kasutatavuse osas

Page 28: Praktilised Avaandmed

Andmetõmmis

" Andmed eraldatakse operatiivsüsteemist ja tehakse kättesaadavaks " Tõmmis on staatiline ning saadaval vaid tervikuna " Rohelises Raamatus soovitatud meetod

" Eeldatakse andmete vananemiskindlust " Tõmmise ei muutu uuendamiste vahel

" Kasulik ja lihtne pakkujale " Madal riskitase " Andmete eraldamise/puhastamise loogika võib olla kui

tahes keeruline

Page 29: Praktilised Avaandmed

Ligipääs andmetele

" Juurdepääs andmetele läbi selge liidese " Sisuliselt avalik juurdepääs operatiivsüsteemile

" Rohkem liikuvaid osi " Lisaks andmete struktuurile ja semantikale tuleb hallata

ka liidese struktuuri ja semantikat " Liides on programm ja sellisena vajab hoolt

" Potentsiaalselt lihtne kasutajale " Andmeid võib kasutada otse, ilma vahepealse

töötlemiseta " Kas avatakse andmed või info?

Page 30: Praktilised Avaandmed

Ligipääs teenustele

" Juurdepääs andmetele läbi äriloogika " Eelmisele sarnane, kuid lisaks andmetele pakutakse ka

äriloogikat " Näiteks aadressi kontrollimine korrektsete aadresside

andmestiku asemel " Veel rohkem liikuvaid osi

" Lisaks muule tuleb hallata ka äriloogikat " Potentsiaalselt lihtne kasutajale

" Juhul, kui andmete kasutamiseks vajalik äriloogika on kas keeruline või tundlik

Page 31: Praktilised Avaandmed

Ligipääs dokumentidele

" Andmete asemel juurdepääs dokumentidele " Dokumendi moodustab komplekt omavahel seotud

andmeid " Võlgnevuse puudumise tõend vs. võlgnevuste tabel vs.

teenus “kas võib osaleda hankes” " Tavaliselt kasutusel, kui tulemust peab lugema

inimene " Kasulik, keerulise andmestruktuuri puhul

" Ning selle üksikuid osi ei kasutata tavaliselt eraldi

Page 32: Praktilised Avaandmed

Milline on tehniline lahendus? !

!

Puudutame vaid peamisi standardeid

Page 33: Praktilised Avaandmed

RDF/XML

" RDF - Resource Description Framework " Standardne vahend andmete struktuuri kirjeldamiseks " Võimaldab esitada väiteid asjade kohta " Võib olla väljendatud mitmel eri viisil, sealhulgas XML

" XML " Küllalt raskepärane viis struktureeritud viisil andmeid

edastada " Võib olla range struktuuriga kuid ei pruugi

" Kasuta neid keerulistel juhtudel: palju keerulise struktuuriga andmeid

Page 34: Praktilised Avaandmed

REST/JSON

" REST " Teenused ja andmeelemendid on viidatud

veebiaadressidega " Andmeelementidega saab manipuleerida veebi tuumaks

olevate protokollidega " JSON

" Veebis levinud viis andmeid esitada, kasutatav otse brauserist

" Ei oma jäika struktuuri " Kasuta lihtsate kiirete lahenduste tarbeks

Page 35: Praktilised Avaandmed

Aitäh!

Andres Kütt [email protected]