· web viewepäsuotuisat arvot puolestaan saavat matalan arvon korkealle haitalle ja korkean arvon...

140
GIS: Kappale 1 Alkuun haluaisin mainita, että tämä ensimmäinen kappale on hyvinkin yleisluontoista ja varmaankin suurimmaksi osaksi melko itsestäänselvää ja tuttua lätinää, eli jos jostain syystä et ehdi kaikkia tiivistelmiä lukea, voinee tämän jättää melko lailla huoletta väliin, sillä tämä kappale käy pintapuolisesti läpi GIS:n perusteita ja tässä selitetyt asiat selvitetään tarkemmin myöhemmissä kappaleissa. Spatiaalisia kysymyksiä tulee ihmisille vastaan päivittäin. GIS ja sen avulla luodut kartat ovat apuna etsittäessä vastauksia näihin kysymyksiin. Näitä kysymyksiä, joihin voidaan saada vastauksia GIS:n avulla, ovat esimerkiksi kysymykset asioiden sijainnista, erilaiset sijaintikuviot (patterns, esim. missä kaupunginosassa asuu eniten vanhuksia), erilaiset trendit tai muutokset tutkittavissa ilmiöissä, ”conditions” (esim. ”näytä hotellit korkeintaan 1 kilometrin päässä rannasta”) sekä ”implications” (esim. millainen vaikutus on alueen liikenteeseen, jos rakennetaan kauppakeskus/lentokenttä tähän). GIS:ä voidaan siis käyttää apuna esimerkiksi tietylle toiminnalle sopivan paikan/sijainnin etsintään. Kaikkia työvaiheita ei GIS:n ansiosta tarvitse tehdä käsin, kunhan perinteisen kartan muodossa oleva tieto saadaan digitoitua (digitoinnista lisää jossain myöhemmässä kappaleessa). Ennen GIS:ä useiden erilaisten karttojen (esim. tieverkosto, maaperä, vesistöt...) sisältämät tiedot saatettiin piirtää läpi alkuperäisen kartan mukaan ja käsin piirrettyjen tietojen perusteella etsittiin toiminnalle soveltuva paikka. GIS:ssä taas aineiston digitoinnin jälkeen kaikki tieto voidaan tuoda paikkatieto-ohjelmaan eri karttatasoilla (layers), jotka voidaan

Upload: others

Post on 27-Jan-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

GIS: Kappale 1

Alkuun haluaisin mainita, että tämä ensimmäinen kappale on hyvinkin yleisluontoista ja varmaankin suurimmaksi osaksi melko itsestäänselvää ja tuttua lätinää, eli jos jostain syystä et ehdi kaikkia tiivistelmiä lukea, voinee tämän jättää melko lailla huoletta väliin, sillä tämä kappale käy pintapuolisesti läpi GIS:n perusteita ja tässä selitetyt asiat selvitetään tarkemmin myöhemmissä kappaleissa.

Spatiaalisia kysymyksiä tulee ihmisille vastaan päivittäin. GIS ja sen avulla luodut kartat ovat apuna etsittäessä vastauksia näihin kysymyksiin.

Näitä kysymyksiä, joihin voidaan saada vastauksia GIS:n avulla, ovat esimerkiksi kysymykset asioiden sijainnista, erilaiset sijaintikuviot (patterns, esim. missä kaupunginosassa asuu eniten vanhuksia), erilaiset trendit tai muutokset tutkittavissa ilmiöissä, ”conditions” (esim. ”näytä hotellit korkeintaan 1 kilometrin päässä rannasta”) sekä ”implications” (esim. millainen vaikutus on alueen liikenteeseen, jos rakennetaan kauppakeskus/lentokenttä tähän).

GIS:ä voidaan siis käyttää apuna esimerkiksi tietylle toiminnalle sopivan paikan/sijainnin etsintään. Kaikkia työvaiheita ei GIS:n ansiosta tarvitse tehdä käsin, kunhan perinteisen kartan muodossa oleva tieto saadaan digitoitua (digitoinnista lisää jossain myöhemmässä kappaleessa). Ennen GIS:ä useiden erilaisten karttojen (esim. tieverkosto, maaperä, vesistöt...) sisältämät tiedot saatettiin piirtää läpi alkuperäisen kartan mukaan ja käsin piirrettyjen tietojen perusteella etsittiin toiminnalle soveltuva paikka. GIS:ssä taas aineiston digitoinnin jälkeen kaikki tieto voidaan tuoda paikkatieto-ohjelmaan eri karttatasoilla (layers), jotka voidaan sovittaa helposti päällekkäin. Jokaisesta paperikartasta siis tehdään oma karttatasonsa, joita yhdessä tutkimalla päästään haluttuun lopputulokseen. Lopputulos riippuu hyvin paljon siitä, millaisia kriteerejä tai vaatimuksia lopullisessa työssä päädytään käyttämään, eli esimerkiksi voidaanko metsää hakata 100 vai 150 metrin päässä järvestä. Valmis malli siis syntyy, kun eri karttatasoja sovitetaan yhteen tietyillä kriteereillä. Esimerkiksi maankäyttösuunnitelmia voidaan tehdä tällä tavalla.

GIS:ä käytettäessä on kuitenkin otettava huomioon joitakin seikkoja, kuten sekä inhimillinen että ohjelmiston mahdollinen erehtyväisyys. Lähtödatassa (source data) saattaa olla virheitä, jotka ovat aiheutuneet esimerkiksi digitoitaessa. Tällöin muuten oikein suoritettu GIS-työskentely ei välttämättä vastaakaan todellisuutta, koska datassa on virheitä jo alun alkaen. Toinen huomionarvoinen seikka on ns. ”abstract concepts” (mikä on ”lähellä” tai ”kaukana”, minkälainen on ”hyvä” tai ”huono”), jotka saattavat vaihdella ihmisten erilaisten mieltymysten tai näkemysten mukaan. Tällaisille asioille olisi luultavasti hyvä sopia esimerkiksi joku absoluuttinen lukuarvo tai vastaava, jotta erilaisten näkemysten aiheuttamat mahdolliset eroavaisuudet eivät näkyisi virheinä lopullisessa työssä. Vielä yksi tärkeä yksityiskohta on se, että käytettävän karttaprojektion (näistäkin lisää myöhemmissä kappaleissa) on oltava yhteensopiva kaikkien työskentelyssä käytettyjen karttojen kesken. Kaikenkaikkiaan GIS-työn lopputulemaa (output) olisikin tarkasteltava kriittisesti.

GIS:n avulla voidaan myös luoda omia malleja, jotka ajamalla tietokone pystyy vastaamaan tutkijan kysymyksiin (kuten mekin teimme kurssin harjoituksissa). GIS mahdollistaa myös eri tieteenalojen välistä yhteistyötä, jossa eri tavalla tutkimusongelmia lähestyvät tutkijat pystyvät tuomaan ajatuksensa ja työnsä esille yhteisessä projektissa. Englanninkielinen termi tälle on ”participatory problem solving”, eli suurin piirtein osallistava ongelmanratkaisu.

Tässä välissä kirjassa on esimerkki GIS:n käytöstä uuden kodin etsinnässä. Prosessi alkaa määrittelemällä halutut muuttujat tai ominaisuudet sekä antamalla näille tietty painoarvo omien mieltymysten mukaan. Muuttujia voivat olla esimerkiksi itse talon sijainti, onko sen lähellä esimerkiksi ruokakauppa tai koulu, alueen maine, alueen hintataso, kämpän koko, huoneiden määrä, onko siinä omaa puutarhaa ja niin edelleen. Näiden ominaisuuksien perusteella voidaan rakentaa malli, joka lopulta näyttää sopivat asunnot kartalla.

GIS siis pystyy yhdistämään ja käsittelemään eri tietokantoja, jotka sisältävät samantyyppistä dataa, ja näin vastaamaan esitettyihin kysymyksiin. GIS:n avulla ei välttämättä tarvitse tai edes pysty ratkaisemaan aina kokonaista ongelmaa, mutta sitä voi käyttää myös jonkin pienemmän osasen ratkaisuun.

Eri GIS-ohjelmistot saattavat antaa samaan kysymykseen keskenään erilaisia tuloksia, mikä kannattaa pitää mielessä työskennellessä. Lisäksi haettavan tiedon on tietysti löydyttävä jostain käytettävissä olevasta tietokannasta.

GIS:ä on määritelty usealla tavalla. Seuraavaksi yritän saada tiivistettyä oleellisimmat tähän. GIS:ä käytetään lyhyesti ilmaistuna arvojen lisäämiseen spatiaaliseen dataan. GIS

1. on tietokonejärjestelmä (computer system), joka

2. käyttää spatiaalisilla viittauksilla/ominaisuuksilla varustettua tai maantieteellistä dataa ja

3. toteuttaa erilaisia (tiedon-?)hallinta- ja analysointitehtäviä.

Hyvä GIS-ohjelmisto tarjoaa nopean ja helpon pääsyn suuriin määriin dataa. Lisäksi se

tarjoaa mahdollisuuden tehdä valintoja alueen tai tietyn aiheen mukaan, linkittää tai yhdistää (merge) eri datasettejä keskenään, analysoida datan spatiaalista luonnetta (just niin), etsiä tiettyä ominaisuutta (characteristics, features) joltakin alueelta, päivittää dataa nopeasti ja halvalla ja mallintaa dataa sekä punnita eri vaihtoehtoja (assess alternatives).

GIS:iin lasketaan kuuluvaksi sekä itse tietokone että ohjelmisto (software). Yleisesti ottaen se tarjoaa tietoa paikoista maan pinnalla. GIS:n harjoittamiseen tarvitaan riittävän tehokas prosessori, joka jaksaa pyörittää ohjelmistoa, riittävästi muistia suurille määrille tietoa, hyvä ja tarkka värinäyttö sekä näppäimistö, skanneri, printteri ym. tietokonesälää. Näiden lisäksi tietysti vielä GIS-ohjelmisto sekä ihminen sitä käyttämään.

Kaikki GIS on siis suunniteltu spatiaalisen datan käsittelyyn. Siispä se tarjoaa tietoa sijainnista sekä myös sellaisten ominaisuuksien välisistä yhteyksistä, joilla ei itsessään ole spatiaalista ominaisuutta (eli ArcMapista tuttu attribute data).

Tieto voi GIS-ohjelmistossa olla siis usealla eri karttatasolla eli layerillä. Eri layereillä olevat tiedot voivat kuitenkin olla eri muodoissa. Kolme perustyyppiä karttakohteiden esittämiseen GIS:ssä ovat pisteet, viivat ja alueet (points, lines areas). Kartalla esitettävä tieto on myös GIS:ssä tietysti aina vähintäänkin jossain määrin yleistettyä. Lisäksi tieto kartalla voi olla esitettynä joko vektori- tai rasterimuodossa.

GIS:n raakadata on tietysti aina jonkun sinne syöttämää. Datan syöttö (data input) voi olla hyvinkin aikaavievää ja kallista, ja tutkimusta tehdessä tämä työvaihe onkin usein selvästi eniten aikaa ja resursseja vaativa. Tietoa voidaan muutosten ilmaantuessa myös päivittää, mikä täytyy myös tehdä käsin, joten sekin on varsin työlästä.

Tiedonhallinnassa GIS:ssä on aina jonkinlainen ”database management system” eli DBMS (suomeksi vaikkapa tietokannanhallintasysteemi). Hyvän GIS-DBMS:n ominaisuuksia ovat ainakin tuki monille käyttäjille ja tietokannoille, mahdollisuus tehokkaaseen päivitykseen, saman tiedon toiston minimointi ja mahdollisuus tiedon riippumattomuuteen, (tieto-?)turvallisuuteen ja eheyteen (indepence, security, integrity).

GIS:n erottaa muista informaatiosysteemeistä se, että se kykenee muuntamaan (transform) spatiaalista dataa esimerkiksi tyypistä toiseen sekä suorittamaan sisältämänsä tiedon avulla spatiaalisia analyysejä.

GIS-analyysin eri työvaiheet tai prosessit voidaan luokitella kolmeen osaan. Nämä ovat tiedon säilyttäminen ja hankkiminen/korvaaminen, kyselyiden (queries) ja sijaintikuvioiden (patterns) hakeminen ja erilaisten prosessien mallintaminen, kuten ennusteiden laatiminen.

GIS-työn lopputulos (data output) on useimmiten (muttei välttämättä aina) kartta jossakin muodossa. GIS-ohjelmistoissa on yleensä hyvät ja monipuoliset mahdollisuudet kartan visualisointiin. Kartan luominen ja viimeistely saattaa olla hyvinkin aikaavievää, mutta se kannattaa tehdä huolellisesti. Karttaa laatiessa on hyvä muistaa se, ketä varten sitä tehdään, jotta lopputulos olisi mahdollisimman tarkoituksenmukainen.

Kuten jo mainittua, GIS vaatii käyttäjäkseen ihmisen. GIS-projekteja tehdään useissa eri mittakaavoissa ja erilaisissa organisaatioissa.

GIS on nykyisin jo vakiintunut teknologia, josta kertoo se, että sen pääpiirteet ovat pysyneet samoina jo parikymmentä vuotta. GIS:ä on harrastettu jo 1960-luvulta lähtien. Nykyisellään se on siis yksinkertaistettuna työkalu spatiaalisen tiedon hallintaan ja analysointiin. GIS on yhä kasvussa, sillä käyttöön tulee jatkuvasti lisää dataa ja tietokoneiden kehitys mahdollistaa entistä monipuolisemmat ohjelmistot. GIS:ä käytettäessä on kuitenkin muistettava se, että työ saattaa myös epäonnistua joko lähtödatassa tai työn myöhemmässä vaiheessa tehtyjen virheiden (inhimilliset virheet, organisaation heikkoudet) vuoksi, minkä takia GIS-töiden lopputuloksia pitää tarvittaessa pystyä tarkastelemaan kriittisesti.

Klp 2 Tilallinen data

Johdanto

GIS esittää yksinkertaistetun kuvan maailmasta.

Aineistot ovat havaintoja, joita teemme tarkastellessamme maailmaa. Aineisto on kerätty faktoina tai todisteina, jonka jälkeen ne voidaan prosessoida, antaa merkitys tai muuttaa ne informaatioksi. Aineiston ja informaation välillä on suuri ero. Jotta ymmärtää näiden kahden termin eron, on hyvä ajatella data numeroina, joita voi nähdä esimerkiksi listattuna taulukossa. Jotta numeroista tehdään käyttökelpoisia niihin täytyy lisätä konteksi. Jotta joku toinen henkilö pystyy ymmärtämään dataasi hänen täytyy tietää mihin data viittaa, mitä yksikköä tai mitta-asteikkoa datassa on käytetty. Näiden yksityiskohtien myötä data muuttuu informaatioksi. Informaatio on aineistoa, johon on lisätty asiayhteys(konteksti).

GIS:ssä on paljon erilaisia aineistolähteitä. Aineisto jaetaan kahteen kategoriaan primäärisiin(ensisijainen) ja sekundäärisiin (toissijainen). Ensisijaiset tietolähteet on tarkoitettu nimenomaan GIS –käyttöön, kun taas toissijaiset tietolähteet joudutaan usein konvertoimaan muista järjestelmistä. Rasterimuotoista esisijaista dataa ovat digitaalinen kaukokartoitus, digitaaliset ilmakuvat, vektorimuotoista on GPS ja mittauskartoitukset. Rasterimuotoinen sekundäärinen tietolähteitä ovat skannatut kartat, valokuvat, digitaaliset korkeusmalllit (DEMs) kartoilta ja paikannimitietokannat.

Ensisijaisella-ja toisijaisella on kolmea mallia tai ulottuvuutta: temporaalinen, temaattinen ja tilallinen. Jokaisessa datassa pitäisi olla tunnistettavissa nämä kolme mallia. Esim. tieto lumivyöryonnettomuudesta, joka tapahtui 14. helmikuuta. Kolme mallia ovat: Temporaalinen(ajallinen): klo 15.30 14. helmikuuta.

Temaattinen: kaksi laskettelijaa laukaisi lumivyöryn

Spatiaalinen(tilallinen): Ylläs

Ajallinen ulottuvuus kertoo milloin aineisto on kerätty. GIS:ssä temaattisella datalla viitataan attribuuttiseen(ominaisuus) tai ei-spatiaaliseen dataan. Spatiaalinen data sisältää informaatiota, joka kertoo paikan sijainnin, esim. x, y- kordinaatein.

Kartat ja niiden vaikutus spatiaalisen datan luonteeseen

Tavallisin tapa säilyttää, analysoida ja esittää spatiaalista dataa on kartalla. Karttoja on monenlaisia ja eri mittakaavoissa. On esimerkiksi teemakarttoja ja topografisiakarttoja. Teemakartta esittää yleensä jonkin tietyn teeman kartalla, esimerkiksi suo, maankäyttö, väestö tai liikenne. Teemakartta kuvaa siis jonkin ilmiön laatua, sijaintia tai levinneisyyttä. Topografiset kartat kuvaavat maaston pinnanmuotoja. Ne sisältävät monenlaista tietoa erilaisista teemoista, jolloin maankäyttö, korkokuva, kasvillisuus ja kulttuuriset piirteet voivat olla kaikki samassa topografisessa kartassa.

Kartan laatijan tulee kertoa mihin tarkoitukseen kartta on laadittu, määrittää mittakaava, valita kohteet, jotka haluaa esittää kartalla, valita metodi/symboliikka, jolla esittää kuvattavat ilmiöt kartalla (pisteinä, viivoina, alueina), yleistää, luokitella, valita projektio ja lisätä legenda yms.

Tarkoitus

Kartat ovat yleistettyjä todellisuudesta. Luonnossa kohteet ovat kolmiulotteisia, mutta kartassa ne kuvataan kaksiulotteisesti. Kartat eivät kuitenkaan ole aina objektiivisesti tehtyjä. Karttojen avulla voidaan siis muokata ihmisten mielikuvaa maailmasta. II maailman sodan aikaan tehtiin paljon propaganda karttoja. Esimerkiksi Euroopan karttaa vääristettiin korostamaan liittoutuneiden valloittamia alueita, koska tämä auttoi nostamaan liittoutuneiden taistelutahtoa. Samanlaisia karttoja tehtiin myös kylmän sodan aikana.

Mittakaava

Kartat on pienennettyjä kuvia todellisuudesta. Mittakaava kertoo kuinka monta senttimetriä maastossa on yksi senttimetri kartalla. Mittakaava voidaan esittää janamittakaavana, suhdelukuna, esim. 1: 5000 tai kirjallisesti 1 cm kuvaa 50 m. Janamittakaava on hyvä keino merkitä mittakaava, sillä suhde pysyy oikeana, vaikka karttaa pienennettäisiin. Kartat jaetaan suuri- ja pienimittakaavaisiin karttoihin. Pienimittakaavaiset kartat kuvaavat laajoja alueita. Pienimittakaavaisia karttoja ovat kartat, joiden suhdeluvun nimittäjä on suuri, esim. 1: 250 000 tai 1: 1000 000. Suurimittakaavaiset kartat, esim. 1:10 000 kuvaavat pieniä alueita yksityiskohtaisesti. Joissakin aineistossa, joita käytetään GIS:ssä, esimerkiksi ilmakuvissa tai satelliittikuvissa mittakaava ei ole heti selvää ja käyttäjä voi joutua laskemaan itse mittakaavan.

Spatiaaliset entiteetit (kokonaisuudet)

Spatiaaliset entiteetit ovat irrallisia geometrisia ominaisuuksia (pisteitä, viivoja ja alueita), jotka on esitetty digitaalisessa data muodossa. Symbolien avulla kuvataan haluttuja ilmiöitä kartalla. Symbolit voidaan jakaa kolmeen tyyppiin: pistesymbolit, viivasymbolit ja aluesymbolit. Kartan mittakaava vaikuttaa symbolityypin valintaan, esimerkiksi kaupunkeja voidaan esittää kartalla eri mittakaavassa. Maailmankartassa kaupunkeja kuvataan yleensä pisteellä, mutta suurimittakaavaisemmassa kartassa piste voisi antaa liian yksinkertaistetun kuvan kaupungista, sillä tässä tapauksessa piste ei kertoisi kaupunkien suhteellisesta koosta.

Pisteet

Pisteitä on käytetty kuvaamaan konkreettisia kohteita, kuten postilaatikko, puu, lyhtypylväs tai käsitteellisiä (kaupunki). Postilaatikkoon voidaan tallentaa tieto sen maantieteellisestä sijainnista ja tieto mikä kohde se on. Sijainnin lisäksi pistesymboli voi kuvata myös määrää, jolloin määrää kuvataan pistesymbolin koon vaihtelulla.

Viivat

Viivoja käytetään kuvaamaan kohteita, jotka ovat lineaarisia luonnossa, esimerkiksi tiet ja joet. Viiva on ketju (x-ja y) kordinaatteja, jotka on yhdistetty viivalla. Lisäämällä z-kordinaatin kuvaamaan syvyyttä tai korkeutta saadaan kolmiulotteinen kuva ilmiöistä. Viivasymbolilla voidaan kuvata myös määrää, jolloin viivan paksuus kertoo määrästä.

Alueet

Alueluokituskarttojen avulla voidaan esittää laadullista tai määrällistä tietoa. Alueilla kuvataan yleensä peltoja tai järviä. Alueet voivat olla myös käsitteellisiä, joita ei ole fyysisesti olemassa, kuten hallinnolliset alueet.

Alue kokonaisuuksilla viitataan yleensä polygoneihin. On kahdenlaisia polygonisia alueita: saareke polygonit ja viereinen/vierekkäinen polygonit. Saareke polygoneja on monenlaisia, ei vain oikeita saaria, esimerkiksi metsä voidaan mieltää ”saareksi” pellon keskellä. Vierekkäiset alueet jakavat saman rajaviivan.

Yleistäminen

Kartta on yleistetty kuva todellisuudesta. Kaikki GIS:ssä käytetty materiaali, esim. ilmakuvat ja kartat sisältävät yleistystä. Kaukokartoituksessa resoluutio määrittää yksityiskohtien määrän ilma- tai satellittikuvassa.Yleistämistä on tehtävä, jotta kartasta ei tule epäselkeä.

Kartan mittakaava vaikuttaa yleistämiseen. Mitä pienempää aluetta kuvataan, sitä enemmän karttaa on yleistettävä. Suurimittakaavaisissa kartoissa on mahdollista esittää yksityiskohtaisemmin kuvattavaa aluetta ,esimerkiksi joen mutkia ja hiekkasärkiä, jotka ovat tärkeitä navigoinnissa.

Kartan tekijällä on vastuu siitä mitä hän haluaa esittää kartalla ja mitkä asiat jäävät kartan ulkopuolelle. Kartan laatijan tulee myös päättää minkä kokoisina esittää ilmiöt kartalla. Todellisuudessa ilmiöt kartalla voivat sijaita vierekkäin tai päällekkäin. Tällöin kartan tekijä voi juotua siirtämään päällekkäisiä kohteita, jotta molemmat kohteet tulevat näkyviin kartalle. Kohteita voidaan myös yhdistää, yksinkertaistaa eli suoristaa, esimerkiksi teitä. Pienimittakaavaisissa kartoissa kartan laatija voi joutua paksuntamaan/liioittelemaan tietä, jotta tärkeä kohde tie näkyisi kartalla. Toisena esimerkkinä liioittelun tarpeellisuudesta: Jos kartalla kuvattu kohde, esim. joki olisi kuvattu tarkasti kartan mittakaavan mukaan, sitä ei välttämättä näkisi paljaalla silmällä. Esimerkkinä 50 m leveä joki 1:1000 000 kartalla täytyisi piirtää viivalla, joka olisi vain 0,05mm leveä, jolloin tätä olisi vaikea havaita.

Muita yleistämisen keinoja ovat sijaintikuvioiden selkeyttäminen, tyypittely (useamman esiintymien joukosta piirretään kartalla näkyviin vain yksi esiintymä) ja symbolointi.

Projektiot (kuva 2.12 s.44)

Projektion avulla maan pyöreä muoto siirretään eli projisoidaan tasolle, jonka takia kartassa on aina virheitä. Karttaprojektion valinta vaikuttaa mitä vääristymiä kartalla näkyy. Karttaprojektioita on monentyyppisiä ja ennen aikaan niitä oli vielä enemmän. Erilaisia projektioita käytetään maapallon eri alueilla erilaisiin tarkoituksiin ja kartoittamaan erikokoisia alueita.

Karttaprojektioita on kolmen tyyppisiä: oikeakulmainen (kulmat ovat oikein), oikeapituinen (tietyt ennalta määrätyt pituudet ovat suoraan verrannollisia vastaaviin välimatkoihin luonnossa) ja oikeapintainen (kartan pinta-alat ovat suoraan verrannollisia vastaaviin pinta-aloihin luonnossa). Samalla kartalla vain yksi ominaisuus voi olla kerralla oikein.

Lieriöprojektio

Perusasentoisessa lieriöprojektiossa lieriön akseli yhtyy maapallon akseliin. Lieriöprojektioon kuuluu Mercatorin lieriöprojektio (kuva 2.13 s. 46). Mercatorin projektio vääristää pinta-aloja sitä pahemmin, mitä kauempana päiväntasaajasta ollaan, sillä lieriönpinta sivuaa projektiossa päiväntasaajaa. Siirryttäessä kohti pohjoisnapaa pinta-ala virheet on isoja. Lieriöprojektio säilyttää erityisesti merinavigoinnissa tärkeät kulmat oikeanlaisina. Transverse Mercator projektiolla on samat ominaisuudet kuin Mercator projektiossa, mutta lieriö on eri suunnassa. Sen etu on, että se säilyttää mittakaavan, muodot ja pienten alueiden sijainnin/suunnan. Tämän takia se on suosittu projektio, kun kuvataan pieniä alueita maapallolla. Lieriöprojektio sopii kartoille, joissa alueen pituuspiiri ei ole pitkä.

Analyysien tuloksiin vaikuttaa minkä projektion on valinnut. Suurimittakaavaisessa kartassa vaikutukset voivat olla vielä pieniä, mutta virheet kasvavat silloin kun käyttää dataa, joka on pienimittakaavassa. GIS:ssä on oleellinen taito on osata muuttaa projektioita.

Tasoprojektio.

Vain osa maapallosta on kuvattuna, puolet tai vähemmän. Vääristymä ilmenee kaikilla neljällä reunalla. Soveltuu hyvin napa-alueiden kuvaamiseen.

Kartioprojektio

Perusasentoisessa kartioprojektiossa virheet ovat pieniä keskileveyspiirillä, mutta kasvavat pohjoiseen ja etelään mentäessä.

Spatial referencing s. 46

On olemassa monenlaisia spatiaalisia referencing (sijainninmääritys systeemejä) jotka voidaan jakaa kolmeen ryhmään. Maantieteellinen kordinaattisysteemi, suorakulmainen-, ja ei-kordinaattisysteemi.

Maantieteellinen: Asteverkko muodostuu leveyspiireistä ja pituuspiireistä, joiden perusteella voidaan määrittää mikä tahansa paikka maapallolla. Pituuspiirit eli meridiaanit kulkevat navalta navalle. 0°-meridiaani kulkee Lontoon Greenwichin kautta. Leveyspiirit eli paralleelit kulkevat päiväntasaajan suuntaisesti. Päiväntasaaja 0° on levein leveyspiireistä. Etelä-ja pohjoisnapa ovat 90 °:n kulmassa päiväntasaajasta ja ne ovat suurimmat leveyspiirien arvot. Aste voidaan jakaa minuuteihin( ' ) ja sekunteihin( '' ). Pituus-ja leveyspiirin sijainnin määritys olettaa, että maapallo on pyöreä. Näin ei kuitenkaan ole, sillä maapallo on geoidin muotoinen, hieman litistynyt navoilta.

The Quaternary Triangulat Mesh refering system yrittää toimia maapallon epäsäännöllisyyden kanssa. Se korvaa leveyspiirit ja pituuspiirit samankokoisilla kolmioilla. Jokainen kolmio peittää samankokoisen alueen maapallonpinnalla. (Kappaleessa 3 käsitellään tätä asiaa tarkemmin) .

Tällä hetkellä GIS:ssä käytetty spatiaalinen data on kaksiulotteisessa muodossa. Suorakulmaisessa kordinaattijärjestelmässä laitetaan ruutuverkko kartan päälle. Pieniä alueita tutkittaessa havaitaan vain pieniä häiriöitä ruudukossa, mutta kun maapallon suuria alueita projisoidaan ruudukko repeää ja leviää. Sen takia suorakulmainen kordinaattisysteemi on suunniteltu käytettäväksi tiettyihin maantieteellisille alueille. Hyvä esimerkki suorakulmaisesta kordinaattijärjestelmästä on Iso-Britannian Ordnance Survey National Grip System. Toinen esimerkki on UTM (Universal Transverse Mercator) kordinaattisysteemi, joka perustuu ruutuverkkoon.Se jakaa maapallon 60 pystysuoraan alueeseen, jotka ovat 6° leveitä vältellen napa-alueita. UTM käyttää Mercatorin poikittaista projektiota.

Ei kordinaatti-systeemi käyttää kuvailevaa koodia, esimerkiksi postinumeroita.

Kaikilla spatiaalisilla järjestelmillä on ongelmansa: postinumeroissa voi olla päivitysongelmia, spatiaaliset entititeetit voivat muuttua, sillä joet meanderoivat ja tiet voidaan uudelleen sijoittaa. Sama objekti on voitu merkitä eri tavoin. Talo on voitu esittää esimerkiksi pisteenä ja alueena eri mittakaavallisissa kartoissa. Spatiaaliset entititeetit (ihmiset, elämiset, autot) voivat olla lisäksi liikkuvia, joten spatiaalinen tieto esittää heidän olinpaikkansa vain tietyllä hetkellä.

Oikean järjestelmän valinta voi olla vaikeaa ja jatkuvasti joudutaan yhdistelemään dataa käyttämällä erilaisia järjestelmiä.

Topologia s.51

GIS:ssä topologialla tarkoitetaan geometrisiä objekteja, jotka eivät muutu kun niitä venytetään tai taivutetaan. Ne ovat itsenäisiä kaikissa kordinaattijärjestelmissä. (TVT3-tunnilla oli tehtävä, jossa laitettiin kartalle pistesymboli kuvaamaan kaupunkia. Aluksi pistettä katsottiin kaukaa. Lähemmäksi mentäessä piste näkyi edelleen yhtä suurena--> erittäin huono selitysyritys, mutta pointtina on, että objektin koko ei muutu katsotaan sitä läheltä tai kaukaa).

Topologi koostuu kolmesta elementistä: viereinen, hallinta ja yhdistävyys. Vierekkäisyys ja hallinta kuvaavat geometristä suhdetta, joka on alueiden välillä. Alueita voidaan kuvata vierekkäisiksi, kun ne jakavat saman rajan. Hallinta kuvaa alueita, jotka voivat sisältää toisen alueen, esimerkiksi järvessä oleva saari. Yhdistävyydellä on geometrinen ominaisuus. Sitä käytetään kuvaamaan linkkejä, jotka yhdistävät pisteitä (tiet).

On tärkeää ymmärtää geometriset suhteet tilallisten entiteettien välilä, jotta voi analysoida GIS:ssä.

Spatiaalisen(tilallisen) datan temaattiset ominaisuudet

Ominaisuustieto on ei-spatiaalista dataa, joka liittyy pisteisiin, viivoihin ja alueisiin. Ominaisuustieto kuvaa kohteen ominaisuuksia ja se voi kuvata mitä tahansa kohteen määrällistä tai laadullista ominaisuutta. Jokaisella spatiaalisella kokonaisuudella (entiteetillä) voi olla enemmän kuin yksi ominaisuustieto, joka yhdistää sitä. Esimerkiksi piste, joka kuvaa hotellia voi kertoa myös huoneiden määrän, hotellin omistajan nimen ja osoitteen.

On monenlaisia mittaamisen skaaloja.

1. Nimellisessä skaalassa numeroita käytetään laatimaan identiteetti. Esimerkiksi hiihtokeskuksessa numerot nimellisessä asteikossa sisältävät puhelinnumeron tai laskettelupassin koodin. Näitä numeroita ei voi tuottaa matemaattisessa mielessä, koska niillä ei ole suhteellista arvoa.

2. Numerot numerojärjestyksessä kuvaavat järjestystä. Järjestysasteikolla kerrotaan, esimerkiksi mitä ovat 10 suosituinta hiihtokeskuksen kahvilaa, mikä perustuu siihen kuinka monta ihmistä käyttää niitä viikoittain. Tämä ei kuitenkaan kerro informaatiota relatiivisesta koosta. Suosituin kahvila ei kuitenkaan välttämättä ole kaksi kertaa niin suosittu kuin kahvila, joka on määritelty toiseksi.

3. Intervalliasteikossa erot numeroiden välillä ovat merkityksettömiä, mutta intervalliasteikolla ei ole oikeaa lähtökohtaa. Esimerkkinä lämpötila, celsium-asteet ovat dataa, joka on kerätty käyttäen hyväksi intervalliasteikkoa. Negatiiviset luvut ovat mahdollisia tässä asteikossa.

4. Suhteellisessa asteikossa voi olla absoluuttinen tai oikea nolla ja ero näiden numeron välillä on tärkeä. Suhdelukuasteikolla mittayksiköllä voi olla absoluuttinen tai oikea nollan arvo, esimerkiksi lumen syvyys. Lumen syvyyttä kuvatessa on mahdollista saada negatiivinen arvo. Kerättäessä ominaisuustietoa käyttäen erilaisia mittakaavan mittayksikköjä ongelmana on, että erot useiden mittakaavojen välillä eivät ole aina selvää.

Jos mittakaavan mittayksikkö ei ole tiedossa tai GIS:in käyttäjä ei tiedä mitä mitta-asteikkoa on käytetty, niin GIS-ohjelma epätodennäköisesti ilmoittaa kun mahdottomia tai turhia operaatioita tehdään. Koneessa kaikki numerot ovat samoja.

Muita tilallisen aineiston lähteitä

On paljon muitakin tilallisen aineiston lähteitä, kuten tutkimus(kartoitus), laskenta, satelliittikuvat, ilmakuvat ja GPS.

Tilasto- ja tutkimusaineisto

Esimerkiksi asukasluku-, työllisyys-, maatalous-tai markkinointieto.

Ilmakuvat

Ilmakuvat olivat ensimmäinen maanpäällinen kaukokartoitus menetelmä. Ilmakuvaus perustuu kohteiden heijastaman säteilyn taltioimiseen. Se on tiedon hankinta ilman suoraa kontaktia kohteeseen. Ilmakuva sisältää paljon dataa, sillä ilmakuvien resoluutio eli erotuskyky on suuri. Kuvat oteteaan rinnakkaisina kaistoina, jolloin vierekkäisten ja peräkkäisten kuvien alasta osa menee päällekkäin. GIS:ssä ilmakuvia voidaan käyttää jonkun toisen datan takana antamaan datalle tilallisen kontekstin ja auttamaan tulkinnassa. Käyttäjä voi tutkia kuvasta esimerkiksi maankäyttöä tai etenevää metsäpaloa. Ilmakuvat ovat erittäin hyödyllisiä kun pitää tutkia muutosta. Ilmakuvia on hyvin saatavissa, maksavat vähän kun vertaa muihin kaukokuviin, korkea spektrinen ja spatiaalinen resoluutio ja se on kolmiulotteinen. On erityyppisiä ilmakuvia tarjolla, esimerkiksi mustia ja valkoisia. Kasvillisuutta tutkittaessa käytetään myös infrapunafilmiä.

Kuvan kuvakulma on tärkeä tekijä. Kuva on vertikaalinen jos se on otettu suoraan lentokoneen alapuolelta ja vinosti jos se on otettu kulmasta. Vinot kuvat peittävät yleensä laajemmat alueen ja ovat halvempia. Pystysuoria kuvia käytetään eniten GIS:ssä. Ennen kuin mitään ilmakuvien informaatiota voidaan käyttää täytyy huomioida mittakaava. Mittakaava on muuttumaton kuvan keskellä, mutta korkeuden kasvaessa kasvavat myös erot keskustan ja reunojen välillä (kuva 2.20s. 57). Tämä aiheuttaa sen, että pystysuorat kohteet kuten vuoret, rakennukset ja puut näyttävät taipuvan poispäin keskustasta. Myös kellonaika ja aika vuodesta vaikuttavat kuvaan. Talvella pitkät varjot voivat auttaa tunnistamaan korkeita puita ja rakennuksia, mutta voivat samalla peittää muita elementtejä kuvasta. Kesällä häiriötä voi aiheuttaa, puiden lehdet, jotka saattavat peittää kuvasta elementtejä. Ilmakuvat ovat hyviä arkeologissa tutkimuksissa, esimerkiksi tutkiessa muinaisten teiden reittejä.

Satellittikuvat ( s.59 kuva 2.21)

Liikkuvat sensorit keräävät satelliittikuvia. Satelliitien sensorit rekisteröivät maanpinnan heijastuksia sähköisinä signaaleina, jotka skannataan digitaalisiksi. Tämä data voidaan prosessoida erilaisin tavoin, joista jokainen antaa erilaisen digitaalisen kuvaversion. Maata kiertää jatkuvasti paljon satelliitteja keräten dataa.

Jotkut satelliiteista ovat geostationaarisia eli ne kiertävät Maata päiväntasaajan yläpuolella Maan pyörimistä vastaavalla nopeudella, jolloin satelliitit pysyvät paikallaan ja kuvaavat samaa aluetta koko ajan. Tälläinen on esimerkiksi Meteosat, joka kuvaa Afrikkaa. Muita satelliitteja ovat, esimerkiksi Landsat ja SPOT. Niillä on temporaalinen resoluutio eli aikaväli, jolla samaa aluetta toistuvasti kuvataan. Esim. SPOT satelliitti 832 km:n korkeudella kuvaa saman kohdan maasta 26

päivän välein. Landsat-satelliitti kuvaa yhtä aluetta yhtäjaksoisesti 16-päivän syklillä.

Moni maapallon observaatio satelliiteista käyttävät ”passiivisia” sensoreita. Sensorit havaitsevat Auringon säteilyn, joka on heijastunut maanpinnalta. Multilaaja scanneri(MSS) havaitsee samanaikaisesti säteilyä neljältä eri aallonpituudelta: lähellä infrapunaa, punaisen, vihreän ja sinisen. Käsittelyn jälkeen kuvia voidaan käyttää havaitsemaan ominaisuuksia, jotka eivät ole helposti havaittavissa paljaalle silmälle.

Pieni määrä satelliitteja käyttää"aktiivisia" sensoreita, joilla on oma mukana oleva energialähde ja joka ei ole riippuvainen maasta tulevasta säteilystä. Esimerkkeinä tutkaan perustuvasta sensorista on SAR ( Synhetic Aperture Radar). Tutka näkee yöllä ja se voi tunkeutua pilviin. Uusi versio aktiivisesti kaukokartoituksesta on on LIDAR (Light Detection and Ranging). Se on kaukkokartoituslaite, joka käyttää lentokonelaasereita kerätäkseen topografista tietoa alhaisilta korkeuksilta. LIDAR:ia käytetään paljon laaja-alaisessa kartoituksessa, koska LIDAR havaitsee muutokset maanpinnan korkeuden vaihtelussa.

Skannetut kuvat ovat tallennettu pikseleinä. Mitä pienempi pikseli sitä tarkempi resoluutio. Landsat Thematic Mapper kerää dataa , jossa pikselien koko on 30m*30m. Pikselin koko ei ole kovin tarkka. joten tällä ei voida tunnistaa, esimerkiksi ihmisten taloja, mutta sitä voidaan käyttää maankäyttömuotojen määrityksessä. IKONOS on kaukokartoitussatelliitti, jossa on erittäin hyvä resoluutio.

GIS:ssä saleettikuvat tuovat monia hyviä etuja. Kuvat ovat aina digitaalisessa muodossa, joten niiden siirtäminen tietokoneelle ei ole ongelmana. Kuitenkin joskus dataa pitää prosessoida, esimerkiksi säätää resoluutiota, vaihtaa pikselikokoa tai muuttaa projektiota, jotta kuvat voidaan yhdistää muuhun dataan. Välillä pilvet voivat aiheuttaa häiriötekijöitä kuvien saannissa.

Tutkimus ja GPS

On monia tapoja kerätä dataa kentällä GIS:iin. Erilaisia tapoja käytetään silloin, kun tarvittavaa dataa ei löydy missään muussa saatavilla olevassa muodossa, kuten karttana tai satelliittikuvana. Perinteisiä manuaalisia tutkimus menetelmiä ovat, esimerkiksi teodoliitti. Modernit digitaaliset laitteet tekevät kuitenkin mahdolliseksi, että kerätty data voidaan tallentaa suoraan digitaalisena formaattina.Uusi ja suosittu tapa kenttämateriaalin keräämiseen on satelliittijärjestelmän käyttö tai GPS.

GPS (Global Positioning System)

GPS on satelliittipaikannusjärjestelmä, joka on ollut alunperin sotilaskäytössä. GPS koostuu 24 satelliitista ja 4 varasatelliitista. Paikanmääritys perustuu aikaan, jonka signaali kulkee satelliitista maassa olevaan vastaanottimeen. Kun GPS saa radiosignaalin se laskee signaaliin kulkemiseen kuluneen ajan ja sen perusteella se voi määrittää etäisyyden satelliitista. Sijainnin määrittämiseen tarvitaan signaali vähintään kolmesta satelliitista. Neljän signaalin avulla voidaan määrittää korkeus. Jokainen satelliitti kiertää maapallon ympäri kaksi kertaa vuorokaudessa.

On kaksi pää GPS-järjestelmää: amerikkalainen NAVSTAR ja venäläinen GLONASS. Eurooppalainen GALILEO piti tulla käyttöön vuonna 2008. Vuoteen 2000 maaliskuun asti USA:n asevoimat pystyivät häiritsemään signaaleja. Nyt se on kytketty pois päältä, mutta USA:n asevoimilla on vielä mahdollisuus häiritä signaaleja varsinkin kriisien ja konfliktien aikoihin, esimerkiksi 9/11 tai Irakin sodan aikaan. Tällä ei kuitenkaan ole tuntuvaa vaikutusta, sillä olemassa on GLONASS. GPS:n käyttöön liittyy muutamia ongelmia. Rakennukset, tiheä puusto, jyrkkä maasto voivat olla haittaamassa signaalia satelliitin ja vastaanottimen välillä.

GIS datan vaatimukset

Markkinoilla on paljon erilaisia GIS formaatteja. Tämä tekee datan jakamisen vaikeaksi ja tarkoittaa että data mikä on tehty tietyllä ohjelmalla ei välttämättä lue hyvin toista ohjelmaa. Tämä on ratkaistu sisällyttämällä GIS-ohjelmiin datan muuntaja. Jotkut datat voivat olla ”export-formaatteina” esimerkiksi E00.

GML (Geography Markup Language)

On komentosarjakieli ja sitä voidaan käyttää mallintamaan maantieteellisiä ominaisuuksia. GML perustuu XML (eXtensible Markup Language). Se sallii spatiaalisen datan vaihdon ja sen avulla voidaan yhdistää kaiken "muotoinen" data.

Kappale 3, Spatiaalisen aineiston mallintaminen (Spatial data modelling)

Johdanto

Tässä kappaleessa käydään läpi mallintamisprosessin kolme perusvaihetta. Tämän jälkeen kappaleessa perehdytään vielä erityisesti siihen, kuinka maanpintaa ja verkostoja voidaan mallintaa. Sitten seuraa on lyhyt yhteenveto siitä, miten lopulta voidaan koota yhtenäinen malli kaikkien mallintamisprosessien jälkeen. Lopuksi vilkaistaan läpi kolmi- ja neliulotteinen mallintaminen.

Kohteiden määritys (Entity definition)

Kohteiden määritys on mallintamisprosessin ensimmäinen vaihe. Kohdetyyppejä on siis kolme (pisteet, viivat ja alueet), joten niistä pitää ensin valita, mikä kuvaisi parhaiten mallinnettavaa ilmiötä (esim. pisteet kuvaavat parhaiten vaikkapa hotelleja).

Mallintamisessa siis yksinkertaistetaan ja yleistetään todellista maailmaa. Todellisen maailman yleistäminen ja yksinkertaistaminen tuo mukanaan myös ongelmia, joista tärkeimmät liittyvät seuraaviin tapauksiin:

1) Kohdetyypin valinta. Mikä kohdetyyppi kuvaisi parhaiten haluttua ilmiötä? Esim. metsäalueen voi kuvata pistein, jolloin jokainen piste kuvaa yhtä puuta. Metsäalueen voi kuvata myös alueena, jonka reunaviiva osoittaa metsän rajan. Kohdetyypin valinta riippuu paljolti siitä, mihin käyttötarkoitukseen malli luodaan.

2) Dynaamisen, jatkuvasti muuttuvan maailman kuvaaminen. Miten ajan myötä tapahtuvat muutokset tulisi kuvata? Esim. metsäalue voi muuttua kun puut vähenevät, jolloin mallinnetun alueen rajaviivakin muuttaa paikkaansa. Pitäisikö harventunut puusto tällöin kuvata mieluummin pisteinä?

3) Erillisten (diskreettien) ja jatkuvien / toisiinsa kietoutuneiden (tai vaihettuvien) ilmiöiden kuvaustapa. Esim. metsäalue on yleensä jatkumo. Eli metsällä ei yleensä ole selkeää rajaa, vaan tiheä metsä vaihettuu vähitellen pensaikoksi jne. Miten siis tulisi kuvata tämä metsän raja-alue (transition zone), joka ei ole selkeä? Missä raja menee?

4) Mallinnettavan ilmiön laajuus ja tarkkuustaso

Esim. laskettelijalle riittää selkeä kartta hissien sijainnista, sekä tieto siitä, ovatko hissit toiminnassa vaiko eivät. Hissien korjaaja taas tarvitsee tiedon mm. hissien sijainnista, niiden korjaukseen tarkoitetuista tukipylväistä ja hissiasemista.

Ei ole siis ihan yksiselitteisen helppoa valita sopivia kohteita kuvaamaan todellista maailmaa. Kohteiden valitseminen riippuu myös paljon siitä, kuka karttaa tulee käyttämään tai millaiseen tarkoitukseen kartta tehdään.

Spatiaaliset aineistomallit (Spatial data models) OK

Mallintamisprosessin toinen vaihe on tehdä graafinen esitys spatiaalisia kohteita sisältävästä aineistosta eli lyhyemmin sanottuna on suoritettava mallinnus. Tämän esityksen voi tehdä kahdella tavalla, eli käyttämällä rastereita ( a raster spatial data model) tai vektoreita ( a vector spatial data model). Luentomateriaalissa nro. 2 on käsitelty tätä samaa asiaa, joten sieltä löytyy myös asiaa selventäviä kuvia.

1)Rasterimalli

Rasterimaailma koostuu yksittäisistä soluista, joista siten myös rakentuvat kohteet (eli pisteet, linjat ja alueet). Yksittäisiä soluja voidaan käyttää kuvaamaan esim. hotelleja (pisteinä) tai niitä yhdistämällä voidaan tehdä soluryhmiä, jotka kuvaavat esim. metsäaluetta. Rakentamalla soluista letkan, ne voivat kuvata esim. lasketteluhissin piuhaa. Rasterimaailman rakennuspalikoita ovat siis solut.

Alueen korkeus voidaan mallintaa siten, että jokaiselle solulle annetaan korkeusarvo. Tämän jälkeen voidaan tehdä korkeuskäyräkartta siten, että solut ryhmitellään korkeusluokkien mukaan omiksi ryhmikseen ja eri korkeusluokkaan kuuluville ryhmille laitetaan oma värinsä. (Lisää tietoa asiasta tiivistelmän lopussa (maanpintojen mallintaminen) sekä luentomateriaalissa nro. 9).

On tärkeää huomioida solun koko, koska se vaikuttaa siihen, miten selkeältä kohde lopulta näyttää (kirjan sivulla 79, kuva 3.10). Liian suuri solukoko tekee kohteesta liian yleistetyn ja karkean. Liian pieni solukoko taas vaikuttaa siihen, että kohde on liian yksityiskohtainen.

2) Vektorimalli

Vektorimaailma koostuu (xy) koordinaatistoon laitettavista pisteistä. Alue- ja linjakohteet rakennetaan siten, että pisteet yhdistetään viivoilla ketjuiksi tai polygoneiksi. Pistekohde taas rakentuu yksinkertaisesti vain yhdestä pisteestä. Mitä monimutkaisempi on alue- tai linjakohteen muoto, sitä enemmän siihen käytetään pisteitä.

On tärkeää ottaa huomioon, kuinka paljon pisteitä käyttää jonkin kohteen mallintamiseen. Jos pisteitä on käytetty liian vähän, saattaa kohde jäädä ns. vajavaiseksi ja epätarkaksi. Jos taas käytetään liian paljon pisteitä, muodostuu tarpeetonta tietoa, joka taas vie esim. tallennustilaa koneelta (s.79, kuva 3.10).

Spatiaaliset aineistorakenteet (Spatial data structures)

Tämä on mallintamisprosessin kolmas vaihe. Spatiaaliset aineistorakenteet mahdollistavat siis sen, että spatiaalinen aineistomalli(katso edellinen kappale) voidaan siirtää tietokoneella digitaaliseen muotoon. Aineistorakenne sisältää sellaista tietoa, jota tietokone tarvitsee muuntaakseen mallin digitaaliseen muotoon. Aineistorakenteet jaetaan rasteri- ja vektoriaineistoihin. Toisin sanoen tässä kappaleessa käsitellään siis rasteri ja vektori –aineistojen koodausta.

1) Rasteriaineistorakenteet (Raster data structures)

On olemassa eri keinoja koodata rasteripohjaisia kohteita. Kirjan kuvassa 3.11 s.80 on selvennetty lyhyesti, miltä koodaus näyttää. Eli kirjan kuvassa kohde näkyy tummennettuina soluina ruudukossa (gridissä) (eli solu = ruutu). Jokaiseen ruutuun on koodattava jokin numero, esim. numero 1 tarkoittaa, että solu kuuluu johonkin tiettyyn kohteeseen ja numero 0 tarkoittaa, että solu on tyhjä. Gridin jokainen solu on koodattava, joten jokainen solu saa jonkin numeron. Numeroiden perusteella nähdään kohteen (esim. parkkialue) muoto ja voidaan esim. laskea sen pinta-ala, kun tiedetään yhden ruudun mitat. Koodatut numerot nähdään myös erillisestä tiedostosta. Tiedostossa numerot ovat samassa järjestyksessä, kuin ruudukossa.

Yleensä jokainen kohde on koodattava omalle tasolleen (layerilleen). Esim. laskettelukeskusta koskevassa esimerkissä hotellit (pisteet), hissilinjat (viivat), metsät (alueet), tiestö (viivojen verkosto) ja maanpinta on kaikki koodattava omille tasoilleen, joten yhteensä saadaan viisi eri tasoa. Vain jos kohteet eivät mene toistensa päälle, ne voidaan koodata samalle tasolle.

Yksi rasteriaineistojen ongelma on niiden koko. Jokaisen solun arvot on tallennettava, joten monimutkaiset ja isot aineistot vievät paljon tallennustilaa. Tätä varten on kehitetty monia tapoja, joilla aineiston voi säilöä pienempään muotoon (jos säilöminen kiinnostaa tarkemmin katso s.81-82, box 3.2).

2) Vektoriaineiston rakenne (Vector data structure)

Eli vektoriaineistoa käsiteltäessä ei käytetä ruudukkoa, kuten rastereiden kanssa. Käytössä on xy –koordinaatisto ja siihen sijoitettavat pisteet. Yksi piste voi kuvata jo itsessään jotain (esim. hotellia) ja useiden pisteiden ryhmät voivat taas kuvata esim. parkkipaikka-aluetta. Kohteet muodostetaan siten, että pisteet yhdistetään viivoilla toisiinsa, jolloin niitä kutsutaan polygoneiksi. Pisteet numeroidaan selkeästi ja jokainen piste sisältää tiedon siitä, mihin polygoniin se kuuluu.

Usein polygonit voivat sijaita vieretysten siten, että ainakin yksi niiden sivuista kulkee päällekkäin toisen polygonin kanssa. Esim. neliön muotoinen parkkialue on voitu jakaa neljään neliöön sen mukaan, kuka mihinkin neliöön voi parkkeerata (esim. henkilökunta, vierailijat, bussit, mopot). Tällöin jokaista eri polygonia ei kannata tehdä erikseen, koska päällekkäisiä viivoja tulee tehtyä ihan turhaan. Ne vievät myös turhaa tallennustilaa. On siis parempi, että vierekkäiset polygonit jakavat saman reunaviivan ja tietenkin ne pisteet, joiden välille yhteinen reunaviiva on vedetty. Jotta sitten pysyttäisiin kärryillä muun muassa pisteiden määrästä, järjestyksestä ja siitä, mihin polygoniin mikäkin piste kuuluu, on pisteet numeroitava, ja jokaiselle pisteelle on merkattava tieto siitä, mihin polygoniin se kuuluu. Tätä kutsutaan pistesanakirjaksi ( a point dictionary).

Ongelmia liittyen vektoridatarakenteeseen:

1)Tietokoneella ei ole tietoa eri polygonien yhteisistä viivoista ja pisteistä. Eli tietokone ei ymmärrä, että polygoneilla on yhteyksiä toisiin polygoneihin. Tietokoneen näytöllä polygonit näyttävät yhtenäisiltä kokonaisuuksilta, mutta tietokone itse lukee ne erillisinä kohteina, tietämättä mitään vierekkäisten polygonien yhteyksistä.

2)Toinen ongelma on ns. ”saari” tai ”reikä” –tilanteet. Eli kun jonkin polygonin sisään halutaan tehdä toinen polygoni, tietokone ei osaa lukea tällaista tilannetta. Tietokone ei siis ymmärrä, että sisempi polygoni kuuluu siihen polygoniin, jonka sisällä se on. Esim. parkkipaikan keskellä voi sijaita infokioski. Tietokone ei ymmärrä, että kioski on parkkipaikan keskellä.

Nämä ongelmat voidaan kuitenkin ratkaista niin kutsutuiden topologisten ominaisuuksien avulla. Topologisten aineistorakenteiden (Topological data structures) avulla kohteille pystytään antamaan topologiset ominaisuudet. Tämän jälkeen tietokone pystyy käsittelemään kohteiden välisiä yhteyksiä. Tietokone ymmärtää siis, että esim. yksi linja voi kuulua kahdelle eri polygonille. Topologiset ominaisuudet siis antavat tietokoneelle tarvittavat tiedot polygonien ja linjojen välisistä yhteyksistä. (Kirjan sivulla 84, kuvassa 3.16 on havainnollistettu, kuinka kohteiden välisiä yhteyksiä voidaan tarkastella tietokoneella erillisistä taulukoista sen jälkeen kun kohteille on annettu niiden topologiset ominaisuudet).

Topologinen aineistorakenne siis takaa, että aineistossa toteutuvat seuraavat asiat:

1) yksikään piste tai linja ei esiinny aineistossa kaksinkertaisena (eli ei ole päällekkäisiä pisteitä tai viivoja), 2) linjat ja pisteet voivat kuulua useampaan polygoniin. Linjoilla ja pisteillä on siis selkeät viittaukset siitä, mihin polygoniin ne kuuluvat, 3) Jokaisella polygonilla on ainutlaatuinen tunnisteensa ja 4) saari ja reikä -polygonit pystytään esittämään tarkasti.

Maanpintojen mallintaminen (Modelling surfaces)

GIS:llä voidaan siis mallintaa eri tyyppisiä maanpintoja. Kirjassa puhutaan erilaisista maanpintakohteista ja niiden mallintamisesta. Tällaisilla kohteilla tarkoitetaan siis esim. korkeutta, saastuneisuutta ja sademäärää. Kirjassa käsitellään tarkemmin korkeuskartan tekemistä (tässä kohtaa voit myös samalla muistella harjoitusta nro 9 ja sen luentokalvoja).

Maanpinnan mallintaminen tapahtuu DTMs:llä (Digital Terrain Models) eli erilaisilla digitaalisilla korkeusmalleilla. Jotta maanpinta voidaan mallintaa, tarvitaan havaintopisteitä, joiden korkeus on tiedossa. Resoluutio saadaan määritettyä käytettyjen havaintopisteiden frekvenssistä. DTMs voidaan koota erilaisista aineistolähteistä kuten esim. topografisista kartoista, ilma- ja satelliittikuvista sekä kenttätutkimuksen tiedoista. Se miten DTMs rakennetaan, riippuu siitä, onko kyseessä rasteri- vai vektoripohjainen GIS. Alla on kerrottu lyhyesti, miten DTMs rakennetaan rastereilla ja vektoreilla (luulisi, ettei tentissä tarvitse tietää näin yksityiskohtaisesta koodauksesta, mutta alla kuitenkin lisää asiasta).

1) The raster approach to digital terrain modelling

Eli rasterpohjaisessa GIS:ssä DTM koostuu ruudukosta. Ruudukon jokainen solu (eli ruutu) sisältää tiedon korkeudesta siltä alueelta, jonka solu peittää allensa. Kappaleessa mainitaan myös Digital Elevation Matrix (DEM), joka sisältää ainoastaan tiedon korkeudesta. DTM taas sisältää korkeustiedon lisäksi muutakin tietoa.

Se miten tarkasti maanpinta voidaan mallintaa, riippuu maanpinnan vaihtelevuudesta ja solun koon määrittämisestä (eli resoluutiosta). Esim. Alppeja mallintaessa on käytettävä paljon enemmän havaintopisteitä ja enemmän soluja (eli on tehtävä siis tiheämpi ruudukko, jotta korkeusvaihtelut voitaisiin mallintaa mahdollisimman tarkasti) kuin esim. Hollannin alavan maan mallintamisessa.

Rasteri DTMs:illä puuhailtaessa voi eteen tulla myös ongelmia. Yksi kirjassa esitelty ongelma on resoluution eli solun koon määrittäminen käsiteltäessä maanpintaa, jonka korkeusvaihtelut ovat hyvin vaihtelevat. Esim. mallinnettavan alueen vasemmassa laidassa voi olla korkeaa ja hyvin vaihtelevan korkuista vuoristoa, joka vähitellen muuttuu tasaiseksi maanpinnaksi siirryttäessä alueen oikeaan laitaan. Vuoristoa mallintaessa olisi hyvä käyttää siis hienoa resoluutiota (eli ruudukkoa, jossa on paljon soluja). Tasaisella pinnalla hienon resoluution käyttö taas on turhaa, koska useat solut kuvaavat samaa korkeutta, mikä johtaa turhan ison tallennustilan tarpeeseen ja pitkittyneeseen työskentelyaikaan. Tasaisella pinnalla olisi hyvä käyttää karkeaa resoluutiota (eli isompia soluja). Tämän ongelman voi ratkaista jo aiemmin mainitulla rasteriaineiston tiivistämistekniikalla(s.81-82, box 3.2) tai käyttämällä quadtree data structure nimistä toimintoa. Kappaleessa ei tosin kerrota, mikä tämä toiminto on. (Kirjan lopussa termi quadtree on selitetty näin: a compact raster data structure which geographical space is subdivided into variably sized homogeneous quarters.)

2) The vector approach to digital terrain modelling

Vektoripohjaisessa GIS:ssä DTM koostuu säännöllisessä matriisissa (ruudukossa) sijaitsevista korkeuspisteistä, jotka kuvaavat maanpintaa. Triangulated irregular network (TIN) (epäsäännöllisistä kolmioista muodostuva TIN-malli) taas on kehittyneempi, monipuolisempi ja yleisempi vektori DTM:n muoto. TIN:ä käytetään säännöllisen tai epäsäännöllisen korkeusaineiston luomiseen. TIN toimii siten, että korkeuspisteet yhdistetään toisiinsa viivoilla. Näistä syntyy epäsäännöllisiä kolmioita (selkeää ruudukkoa ei ole, kuten pelkässä DTM:ssä). Kirjan sivulla 91, kuvassa 3.24 on kuvattu vektori DTM ruudukon ja vektori TIN ruudukon ero. Mitä vaihtelevampi maanpinnan korkeus on, sitä enemmän on otettava käyttöön korkeuspisteitä. TIN:in hyvä puoli on se, että se ei vie paljoa tallennustilaa.

Kirjassa kerrotaan yksityiskohtaisemmin vielä siitä, kuinka korkeuspisteet valitaan. Eli kaikkia korkeushavaintopisteitä ei tarvitse käyttää maanpinnan mallintamiseen, vaan havaintopisteistä valitaan kaikkein ”tärkeimmät / merkittävimmät” pisteet. Sivulla 93, box 3.6 on kerrottu yksityiskohtaisesti, miten korkeuspisteiden valinta tapahtuu. Pääidea on kuitenkin se, että ne pisteet, joita ei voi interpoloida naapuripisteisiin, ovat merkittäviä pisteitä. Taas ne pisteet, jotka voidaan interpoloida lähellä sijaitseviin naapuripisteisiin, ovat tarpeettomia TIN:n kannalta. (Samaan hengen vetoon mainitaan myös lyhyesti, kuinka pisteet yhdistetään toisiinsa. Viivat voidaan vetää 1) pisteiden etäisyyksien mukaan tai 2) käyttämällä tekniikkaa nimeltä Delanuary triangulation (s.94) ). Huom. jotta saisi selkeämmän kuvan DEM:n ja TIN:n eroista vektoripohjoisessa GISsissä, kannattaa katsoa kuva 3.25 s.92. Kuva on myös luentomateriaalissa nro 9.

Verkostojen mallintaminen (Modelling networks)

Verkostot mallinnetaan yleensä aina vektori-GIS:llä. Verkostojen mallintamisessa käytetään siis jo tutuksi tulleita pisteitä (eli noodeja) ja viivoja/linjoja, mutta myös muita attribuutteja. Viivat/linjat, joita verkostojen yhteydessä kutsutaan linkeiksi, kuvaavat siis maanteitä, rautateitä, putkistoja ym. eli ne ovat pisteiden välisiä linkkejä. Pisteet taas voivat kuvata erityisesti 1) noodeja (nodes), 2) pysäkkejä (stops) ja 3) keskuksia (centres). Käännöskohdat (turns) merkitään verkostoon nuolin. Noodit/pisteet ovat samalla siis käännöskohtia, koska niiden kautta voidaan kääntyä eri linjoille. Nuolen suunta näyttää siis sen suunnan, mihin noodilta voidaan kääntyä.

1) Noodeilla tarkoitetaan yksikertaisesti linjojen päätepisteitä (esim. liikenneverkon risteys tai jokihaarojen yhtymäkohta). 2) Pysäkeillä tarkoitetaan sellaisia paikkoja, joissa saatetaan vierailla matkan aikana. Pysäkit voivat olla myös esim. bussipysäkkejä, joitain kuljetusalan jakelupisteitä, joihin tuodaan tavaraa ja joista noudetaan tavaraa, tai vaikkapa sedimenttilähde jokiverkostossa. Pysäkit ovat siis pisteitä, joihin ihmiset, tavarat ja luonnonvarat siirtyvät ja joista ne myöskin siirtyvät pois jonkin kuljetustavan voimin. 3) Keskuksia voivat olla esim. koulut, sairaalat, lentokentät, kauppakeskukset tai jopa kokonainen kaupunki (keskuksen koko riippuu mittakaavasta).

Kaikki yllä mainitut verkostoihin liittyvät piirteet (linkit, käännöskohdat, noodit, pysäkit ja keskukset) tallennetaan attribuuttitietona vektorimalliseen tietokantaan.

Kappaleessa kerrotaan vielä muutama verkostoihin liittyvä piirre, jotka olisi hyvä ottaa huomioon verkostojen analysointivaiheessa. (Tämä tieto ei liene olevan kovin oleellista peruskurssilaisille..)

1) Verkostoissa tapahtuvat kulut (impedance). Kappaleessa kerrotaan siis kuluista, jotka aiheutuvat verkostoissa tapahtuvista toiminnoista. Nämä kulut voivat syntyä kun esim. kun vieraillaan kauppakeskuksissa, pysähdytään bensa-asemalla tai kun vain kuljetaan paikasta toiseen linkkejä pitkin. Nämä kulut on tärkeää ottaa huomioon esim. valittaessa matkareittiä. Kulut voidaan mitata mm. rahassa, ajassa, kuljettajan palkassa tai polttoaineen määränä. Esim. linkkiin (eli maantiehen) liittyvä kulu voi olla aika, jota mitataan siten, kuinka kauan aikaa kuluu kulkea noodilta a noodille b. Kirjan kuvassa 3.28 on ryhmitelty erilaisia kuluja sen mukaan, aiheutuvatko ne linkeillä, käännöskohdissa tai pysäkeillä.

2) Keskusten tarjonta ja kysyntä (supply&demand). Tarjonnalla tarkoitetaan siis sitä resurssien määrää, jolla keskus pystyy tyydyttämään verkostossa olevien linkkien kysynnän. Kysyntä taasen meinaa resurssien käyttöä.

Tärkeää on, että verkostoja kuvaavissa malleissa säilyy oikea topologia ja kohteiden väliset yhteydet.

Tietokonemaailmojen rakentaminen (Building computer worlds)

Eli edellisissä kappaleissa on kerrottu, kuinka rasteri- ja vektorimalleja käyttäen on voitu rakentaa kohteita. Tässä kappaleessa keskitytään siihen, miten ns. tietokonemaailmoja (lopullisia malleja oikeasta maailmasta) voidaan rakentaa kohteita ryhmittelemällä. Tätä varten on olemassa kaksi vaihtoehtoa: 1) tasot (layers) ja 2) objektit (objects).

1. Tässä tapauksessa lopullinen malli muodostuu siis erillisistä tasoista, joista jokainen kuvaa alueen eri piirteitä (esim. kasvillisuustaso, vesistötaso, tiestötaso ja asuinaluetaso..luulisi olevan tuttua jo kaikille..). Lopulta tasot liitetään päällekkäin, ja näin saadaan valmis malli.

2. Objekteihin perustuvassa mallissa idea taas on, että erilliset objektit on ryhmitelty erilaisiin luokkiin ja hierarkioihin. Tasoja ei käytetä ollenkaan. Tätä tapaa kutsutaan nimellä object-oriented (OO) programming. Esim. jokin objekti (esim. polygoni) voi kuulua luokkaan nimeltä laskettelukohde. Tälle objektille taas on voitu tallentaa tieto siitä, mitä se kuvastaa oikeasti (esim. parkkialuetta tai lasketteluhissiä). Objektit voidaan ryhmitellä myös sen mukaan, mitä ne GIS:ssä edustavat (esim parkkialue voi kuulua luokkaan alue (area)).

Kolmiulotteinen mallintaminen (Modelling the third dimension)

Millään nykyisellä GIS ohjelmalla ei voida tehdä kolmiulotteisia malleja. Tekniset vaikeudet estävät maantieteellisen tilan esittämisen kolmiulotteisena (etenkin topologian kuvaamisen). Vain ortografisia projektioita käyttämällä pystytään jäljittelemään kolmiulotteista kuvaa.

Kehitteillä kuitenkin on kolmiulotteisia GIS-ohjelmia. Worboys kertoo esim. kuinka rasteriruudukon solun voisi tehdä kolmiulotteiseksi. Tällöin solua kutsuttaisiin termillä voxel. Sen ongelma olisi kuitenkin se, ettei siihen voisi kytkeä topologista tietoa.

Modelling the fourth dimension

Tässä kappaleessa puhutaan ajankulusta ja sen vaikutuksesta GIS-tietokantaan. GIS-tietokannan kohteet kuvaavat aina jotain tiettyä hetkeä. Esim. tehtäessä työläitä, isoja tietokantoja, haasteellista on mallintaa kaikki kohteet tietyn ajan sisällä. Kappaleessa kerrotaan, että mallintamiseen kuluva aika on erittäin monitahoinen, koska se jakaantuu kolmeen eri aikaan: 1) työntekoaikaan (work practice time), tietokanta-aikaan (database time) ja 3) tulevaisuusaikaan (future time).

1) työntekoajan aikana GIS-tietokannan tila on väliaikainen. Tällöin useat ihmiset käyttävät tietokantaa samaan aikaan päivittäen sitä useasti.

2) tietokanta-aika taas kuvaa sitä aikaa, jolloin tietokannan ajatellaan olevan jo virheetön. Ongelmia kuitenkin ilmenee, kun liikkeellä on useampi kuin yksi versio tietokannasta, eikä kukaan tiedä, kuka sitä voi päivittää ja milloin.

3) GIS:llä tehdään usein malleja, jotka pyrkivät kuvaamaan tulevaisuutta (esim. lumivyöryjen ennustaminen). Tulevien tapahtuminen kuvaaminen voi olla erittäin haasteellista, kun käsiteltävänä useita erilaisia skenaarioita yhdestä aiheesta (s.102 box 3.8 -> esimerkki rannikon muuntumisen mallintaminen)

Kohteita koskevia aikaongelmia ratkottaessa on hyvä ottaa huomioon kolme asiaa:

1) mitä asioita tulisi ylipäätään sisällyttää tietokantaan?, 2) kuinka usein tietoa tulisi päivittää? ja 3) milloin vanhan tiedon tallentaminen tulisi lopettaa?

On siis ongelmallista esim. jos useiden ihmisten eri alueilla pitää päästä käsiksi samaan tietokantaan samaan aikaan. Tällöin he voivat tehdä muutoksia kohteen ajalliseen statukseen. He eivät tee uudelle tasolle uusia kohteita eri ajoilta vaan tallentavat uudet kohteet sellaisenaan edelliset kohteet korvaten. Tällöin tietokannassa voi olla eri ajanjaksoilta tallennettuja kohteita.

4 Database Manamegent

Tietoa kerätään jatkuvasti, myös tiedostamattasi. Ostosuoritukset, julkisen liikenteen matkat ja plussakortin vinguttaminen jättävät kukin jäljen rekistereihin ja tietoa tallennetaan tietokantoihin. Yhdellä ostosuorituksella saattaa tietoa päivittyä jopa neljään eri tietokantaan (myymälä, kanta-asiakastiedot, tuotteet, ajankohta jne.) Tietoa syntyy siis jatkuvasti hirvittäviä määriä. Tämän informaatiotulvan suodattamiseen tarvitaan tietokantoja (database), ja niiden käsittelyä / hyödyntämistä mahdollistavia sovelluksia (database manamegent systems). Tiedonkeruu on tärkeää, sillä dataa analysoimalla voidaan kehittää vallitsevia olosuhteita.

Tietokantojen avulla on siis mahdollista listata ja luokitella aineistoa eri ominaisuuksien perusteella. Tämä lisää tiedon arvoa ja mahdollistaa analyysit. Esimerkkinä verkkotietokannasta on kirjasto-palvelut, jossa näkee tehdyt varaukset kronologisessa järjestyksessä ja täten yksittäisen käyttäjän on mahdollista arvioida oman varauksen edistymistä. Tietokantojen linkittäminen GIS:in nostaa tiedon arvoa ja välittää tärkeää tietoa silloin kun niihin liitetään spatiaalinen ulottuvuus.

AM/FM (automated mapping and facilities manamegent) on väline jota suuryritykset (esimerkiksi öljy-, vesi-, ja kaasuala) käyttävät GIS:in rinnalla. Tämä ohjelmisto antaa käyttäjälleen mahdollisuuden digitoida, hallita ja analysoida hyödykeverkoston dataa. Data johdetaan spatiaaliseen ulottuvuuteen ja saadaan tarvittaessa karttaesitys.

GIS:ssä on kahdentyyppistä tietoa: spatiaalinen tieto (paikkatieto) ja ominaisuustieto, joka riippuu siitä mitä halutaan esittää. Tavallinen data on liitetty GIS:iin monella tapaa ja kun sille annetaan jokin selvitys (ominaisuus) siitä muodostuu informaatiota. Esim. luku 10 → 10 ۫C. Tietokannassa tätä tietoa voidaan jäsennellä ja siitä voidaan muodostaa spatiaalisessa kontekstissa informatiivinen karttaesitys. Kun puhutaan tietokannasta, se vaatii, että data on jäsenneltyä. Tietokanta voi olla manuaalinen tai tietokonepohjainen.

Tavallisen tiedonhallinnan (tiedot erossa toisistaan) ongelmia:

- Päällekkäisyys (tietoa pitää toistella)

- Suuret ylläpitokustannukset

- Kestää aikaa, kun tietokannan oppii tuntemaan

- Vaikeudet liikkua tietokantojen/systeemien välillä

- Yksittäiset muutokset datassa tilapäisiä

- Vaikeudet jakaa dataa

- Turvallisuuden ja standardien puute

- Erilaiset käytännöt luoda ja ylläpitää tietokantoja (vaikeudet välittää tarvittaessa)

- Datan säilytysmekanismit ovat joustamattomat

- Ei voida tarkastella tietojen välisiä suhteita (analyysit)

→ Tarvitaan tietokantoja!

→ Data voidaan jakaa eri käyttäjien välillä

→ Organisoiminen helppoa; helpompi saatavuus, ei päällekkäisyyksiä

Kuvitellaan esimerkiksi puhelinluetteloa (manuaalinen tietokanta)

- Ei voida tehdä esimerkiksi hakua etunimen perusteella (joustamattomuus)

- Ei suojaa / turvallisuutta

- Päivitys hidasta ja kallista

→ Tarvitaan tietokoneita, koska:

1. Dataa voidaan hakea eri ominaisuuksilla

2. Data säilötään eri sovellusten käyttöön

3. Päällekkäisyydet minimoituvat

4. Datan käsittely kontrolloitua ja keskitettyä (salasanat, luotettavuus)

5. Helppo ylläpitää ja päivittää

6. Aineistokyselyt mahdollisia ja niiden kieli (komennot) on standardisoitu

(Lisävinkkinä katsokaa suomalaisesta wikipediasta "tietokanta" tai "DBMS" englantilaisesta, jos haluatte syventää tai selkeyttää tietouttanne. Seurailen tässä itse kirjan sanomisia.)

Database Management System (DBMS) on tietokannan hallintajärjestelmä, joka tarjoaa käyttöliittymän tietokantaan. Ohjelmalla muodostetaan data tavallaan käytäntöön, eli esimerkiksi hotellin varaustilanne voidaan tarkistaa ja tyhjä huoneisto buukata. Kyseessä on siis ohjelma, jolla hallitaan datan säilöntää, saatavuutta ja muunneltavuutta. Lisäksi sillä on mahdollista yhdistää, muokata ja käsitellä dataa.

DBMS:n toiminnot:

- tiedoston käsittely ja hallinta

- lisäys, päivitys ja poisto (rekisterit)

- informaation muodostaminen datasta (kyselyt, datan järjestäminen)

- datan turvallisuuden / jakamattomuuden varmistaminen

- sovellusten rakentaminen

Päätehtävänä on kuitenkin datan käsittelyn helppous ja monipuolisuus!

DATABASE DATA MODELS

Hierarkinen, verkosto, suhteellinen, kohderiippuvainen ja kohdeorientoitunut datamalli.

Suhteellinen datamalli (relational data model) on näistä selkeästi eniten käytetyin.

- Data järjestetään kaksiulotteiselle tasolle.

- Linkittyminen

- Data pysty- ja vaaka-akselille

- Nolla-arvo ei ole tiedossa

- Taulukon rakenne on joustava, kyselyt mahdollisia

Komentoja: SELECT (valitse rivi), PROJECT (valitse sarake) JOIN (yhdistä)

= SQL (Standard Query Language)

- Yhtenäisyys, helppous

- Ei maantieteellistä ulottuvuutta (lähellä, kaukana jne.)

Ongelmia:

- Joitakin päällekkäisyyksiä

- Voi olla hidas ja hankala toteuttaa

- Puutteet monimutkaisten kohteiden käsittelyssä

- Rajoitettu määrä detaljityyppejä

→ Suhteelliset tietokannat luotiin käsittelemään yksinkertaista businessdataa, eikä moniulotteista spatiaalista dataa. Kuitenkin sitä voidaan käyttää moneen tarkoitukseen myös maantieteellisessä tutkimuksessa.

CREATING A DATABASE

1) Datan tutkiminen ja etsiminen

2) Datan mallinnus: suhteet, piirteet

3) Tietokannan suunnittelu: nimistö, tyypit, luokitus

4) Tietokannan toteutus; visualisointi, ylläpito ja päivitys

Tietokantoja voidaan linkittää yhteisten arvojen (esim. ID) mukaan. Näin ominaisuustieto voidaan yhdistää myös spatiaaliseen aineistoon.

GIS DATABASE APPLICATIONS

1) Single-user small databases

2) Corporate databases

3) Office information systems

4) Engineering databases

5) Bibliographic databases

6) Scientific databases

7) Image and multimedia databases

8) Geographic databases

-Yksittäiselle käyttäjälle tärkeää joustavuus ja helppokäyttöisyys.

- Isommalle yritykselle turvallisuus, luotettavuus, integrointi, suorituskyky jne.

- GIS on integroitumassa monille toimialoille ja sitä käytetään yhä laajemmin työvälineenä.

1) Centralized (keskitetty) database system

- Kaikki systeemit ja data yhdellä tietokoneella

- Tietokantaan pääsee sovellusalustojen (platforms) avulla

- Trendi siirtymässä pois tästä käytännöstä

2) Distributed (jaettu) database system

- Internet paras esimerkki. Lukuisat tietokoneet ylläpitävät tietoa verkossa.

- Verkoston kapasiteetti on niin suuri, ettei sen tietomäärää olisi mahdollista keskittää.

- Tehokkuus

- Turvallisuusriskit?

Suuryritysten vaatimuksia tietokannoille:

1) Tarve rinnakkaiseen pääsyyn ja päivityksiin (yhtäaikainen käyttö)

2) Tarve hallita pitkiä transaktioita (esim. päivitykset)

3) Tarve pitää useita näkymiä ja ikkunoita samanaikaisesti esillä samasta tietokannasta.

- Esimerkiksi pankkipalvelu, jossa pankkivirkailija ja yksityishenkilö voivat yhtä tehokkaasti päivittää asiakastiedot.

Yleisimmät ongelmat:

- Kompeksisuus → koulutus

- Kustannukset (ohjelmat, kehitystyö, design, ylläpito..)

- Prosessorin tehottomuus (käyttäjätarpeiden muutos)

- Jäykkyys, joustamattomuus

Maantieteellisen datan kolme elementtiä: space (tila), theme (teema) ja time (aika)

Esimerkkiongelmia slummien suunnittelusta Ghanassa:

- Suunnittelun tarkoituksesta / päämäärästä ei ollut tarpeeksi tietoa

- Tekninen osaaminen tiedon keräämisessä ja analyysivaiheessa heikkoa

- Yhteistyön puute eri organisaatioiden välillä joustamatonta

- Logistiikan ja seurannan puute

- Aineiston epäloogisuus, puutokset lakipykälissä ja jatkuvasti muuttuva tilanne

Web GIS:

- Data usein servereillä, jonka ohjelma (client) avaa tietokoneella

- Esimerkiksi Google Earth (karttaserveri) ja ohjelma kommunikoivat reaaliaikaisesti (HTTP)

- Sovellukset, plug-init, java jne...

- On myös mahdollista että ohjelmalla on prosessoivia ominaisuuksia eri servereillä, jotka kommunikoivat internetin kanssa.

- Katso kuvat 4.12 (s.124) ja 4.13 (s.125), niin tämä aukeaa hieman paremmin

Web-based Interface to Census Interaction Data (WICID)

- Ohjelmistosysteemi pohjana Census Interaction Data Service:lle (CIDS)

- Käyttäjäystävällinen, helppo pääsy aineistoihin

- Väestönlaskujen vertailu

- Analyysit

Reaaliaikainen tietokanta on uusi haaste yhteiskunnalle.

- Kallis, työläs

- Internet, langaton verkko ratkaisuina? (automaattiset päivitykset)

- Esim. HKL:n julkisen liikenteen päivitykset reaaliajassa.

DEVELOPMENTS IN DATABASES

Relational (suhteellinen) approach ja sen ongelmia:

- Spatiaalinen data ei sovi luonnostaan taulokoihin

- SQL-kieli ei vastaa maantieteellisiä vaatimuksia

→ tulisiko sitä kehittää?

Object-oriented (kohdeorientoitunut) approach

- Mahdollisuus liikkua kauemmas geometrisestä datamallinnuksesta (pisteet, viivat, polygonit)

- Malli on lähempänä reaalisia asioita

- Mahdollisuus valita objektien rakenne

Object = state + behaviour (Objekti = olomuoto + käyttäytyminen)

- State = arvot ominaisuuksista

- Behaviour = metodit, joilla kohdetta voidaan käsitellä

→ Kohteen uniikki identiteetti

→ Yhdistettyjä objekteja voidaan luoda

Otetaan kirjan esimerkki (object oriented) Happy Valley Laskettelukeskuksesta:

- State = ominaisuudet (ID, osoite, puhelinnumero...)

- Behaviour = käyttäytyminen (tarve lisähuoneille, standardien muutos, aikainen sulkeutumis-ajankohta) joka tallennetaan

- Sivun 129 kaaviot havainnollistavat tarvittaessa.

Object-oriented (kohdeorientoitunut) approach on hyvä maantieteelliseen dataan, koska:

- Se mahdollistaa kompleksisten, reealisten objektien mallinnuksen

- Ei erota spatiaalista ja ominaisuustietoa (yhteenpakkaus: state+behaviour)

- Sopii graafisiin ratkaisuihin

- Mahdollisuus uudelleenkäyttää objektin osatekijöitä jossain toisessa objektissa

- Operaatiot, kuten piirto, luonti ja poisto jokaiselle objektille

Kappale 5: Tiedon syöttäminen ja editoiminen

”GIS ilman dataa on kuin auto ilman polttoainetta – ilman polttoainetta et voi mennä minnekään.”

Kappaleen idea:

· Selittää ero analogisen ja digitaalisen tiedonlähteen välillä

· Antaa esimerkkejä tavoista syöttää tietoa

· Selittää kuinka paperikarttoja digitoidaan

· Kertoa kuinka kaukokartoitetut kuvat voidaan siirtää GIS järjestelmään

· Kertoa ongelmista, joita spatiaalisen tiedon syöttämiseen voi liittyä

· Antaa esimerkkejä tavoista muokata tietoa

· Selittää pääpiirteittäin integroidun GIS tietokannan luomiseen tarvittavaa prosessia

Johdanto:

- Tiedon syöttämisellä (Data encoding) tarkoitetaan yksinkertaisuudessaan tiedon lisäämistä koneelle.

- Spatiaalista tietoa voidaan hankkia monesta eri lähteestä (Katso kappale 2). Sitä saadaan erilaisissa formaateissa. Lisäksi sitä voidaan lisätä GIS järjestelmään monella tavalla:

· Digitaaliset tai paperiset kartat voidaan joko digitoida, skannata tai siirtää suoraan järjestelmään.

· Ilmavalokuvat voidaan skannata

· Satelliittikuvat voidaan ladata suoraan digitaalisesta mediasta

· Dataa voidaan myös lisätä suoraan GPS laitteesta tai ladata verkosta (Esim. Paituli)

- Kun tieto on saatu lisättyä järjestelmään, yleensä sitä joudutaan muokkaamaan seuraavilla tavoilla:

· Projektion muuttaminen tai kartan liittäminen projektiojärjestelmään

· Monimutkaisen tiedon generalisoiminen

· Digitaalisten kartta-aineistojen yhteen liittäminen (match and join)

- Tiedon lisäämisen ja muokkaamisen prosessia kutsutaan nimellä Data stream (Katso kuva 5.1 s.135).

- Analogisella spatiaalidatalla tarkoitetaan alueellista tietoa, joka joudutaan muokkaamaan digitaaliseen muotoon, ennen käyttöä GIS järjestelmässä. Tällaista dataa on paperin muodossa olevaa tieto: yleensä kartat, tilastotieto tai tuloste-muotoiset valokuvat.

- Digitaalisella spatiaalidatalla tarkoitetaan alueellista tietoa, joka on valmiiksi tietokoneen luettavissa. Tällaista tietoa on esimerkiksi: ilmavalokuvat, satelliittikuvat, tietokantojen sisältämä tieto, sekä dataloggereiden ja GPS-laitteiden sisältämä tieto.

- Mikäli kaikki tieto olisi saman tyyppistä, samassa formaatissa, skaalassa ja resoluutiossa, koodaaminen ja integroiminen olisi helppoa. Näin ei kuitenkaan yleensä ole. Tiedon lähteet ja muodot ovat kompleksisia, tosin viime vuosina on pyritty kehittämään universaaleja GIS-data-standardeja ja tiedon siirron formaatteja.

Tiedon syöttämisen tavat:

- Perusperiaatteiltaan paikkatieto-ohjelmat toimivat samalla tavalla, mutta asioiden toimeenpanon käytännöt vaihtelevat (vielä) paljon. Käyttäjä voi joutua kohtaamaan erinäisiä ongelmia siirtäessään dataa ohjelmasta toiseen.

- Analogista dataa voidaan muokata digitaaliseen muotoon kirjoittamalla näppäimistöllä, digitoimalla (joko manuaalisesti tai automaattisesti), sekä skannaamalla.

- Digitaalinen data pitää ladata lähdemediasta (disketiltä, levyltä, netistä). Sen jälkeen se saattaa vaatia formaatin muuttamista sopivaksi paikkatieto-ohjelmaa varten.

- Mahdolliset tavat koodata erilaista dataa on esitelty taulukossa 5.1 sivulla 136.

Näppäimistön käyttö datan koodaamiseen (Keyboard entry/keycoding)

· Käytetään yleensä attribuuttidatan lisäämiseen, jota ei ole saatavilla digitaalisessa muodossa.

· Ongelmana kirjoitusvirheet. Mikäli aineisto on hyvin laaja, on suositeltavaa käyttää tekstiskanneria (OCR).

· Kun attribuuttidata on saatu digitaaliseen muotoon, se linkitetään relevantteihin karttakohteisiin käyttämällä alueellisen tietokannan identifikaatiokoodeja (Valmis taulukko yhdistetään ominaisuustietotaulukkoon jonkin tunnisteen, esimerkiksi nimen tai postinumeron, avulla).

· Myös koordinaatit on helppo keykoodata, mikäli niitä ei ole tolkutonta määrää.

Manuaalinen digitointi

· Yleisin tapa koodata alueita paperikartoilta on manuaalinen digitointi.

· Tekniikka on omiaan tapauksissa, joissa on tärkeää saada kohteen topologia visualisoitua selkeästi.

· Manuaalista digitointia käytetään myös ilmakuvien tiettyjen kohteiden digitointiin (esimerkiksi lumipeite).

· Manuaalinen digitointi tapahtuu digitointipöydällä joka on kiinnitetty tietokoneeseen. (Kuva manuaalisesta digitointipöydästä 5.2 ja käyttöohjeet BOX 5.1, sivulla 137)

· Digitointipöytä toimii kahdella moodilla (point & stream). Point-moodissa digitoija voi itse asettaa pisteet mihin kohtaan haluaa. Stream-moodissa kursoria liikutellaan ja kone asettaa pisteet ajan mukaan (mitä monimutkaisempi kohta, sitä useampia pisteitä, koska kursoria joutuu liikuttamaan hitaammin). Kirja esittelee myös bézier-työkalun, joka toimii samalla periaatteella kuin CorelDraw:ssa s. 139.

· Digitointeja on ulkoistettu halvan työvoiman perässä Intiaan. Mikäli Intian GIS-teollisuus kiinostaa -> BOX 5.2 s. 140-141.

· Pieniä määriä dataa voidaan myös digitoida manuaalisesti skannatuista ja geokorjatuista (projektio ja koordinaatit) digitaalisista karttakuvista suoraan paikkatieto-ohjelmalla (onscreen digitizing).

Automaattinen digitointi

· Manuaalinen digitointi on aikaa vievää ja tylsää, siksi isot määrät monimutkaisia karttoja kannattaa digitoida automaattisesti.

· Automaattinen digitointi on yleensä kalliimpaa kuin manuaalinen digitointi.

· Automaattinen digitointi tapahtuu joko skannaamalla tai systeemillä, josta kirja käyttää nimeä automatic line following.

· Em. metodeista skannausta käytetään useammin. Se soveltuu hyvin rasteriaineiston tuottamiseen.

· Skannauksen ongelmia:

· Optinen vääristyminen

· Ei-haluttua informaatiota saattaa skannautua mukana. Esimerkiksi kahvitahroja ja ryppyjä.

· Skannerin säätäminen, jotta juuri oikea data saadaan hyvin näkyviin

· Tuotettujen tiedostojen formaatti ja sen siirtäminen GIS softaan.

· Editoinnin tarve, jotta saadaan analysoitavaksi kelpaavaa dataa

· Skannerin käyttöohjeet ja kolmen eri tyypin skannerin esittely s. 142

· Skannatun datan laatu riippuu kolmesta tekijästä: Skannerista (käytetty resoluutio), kuvan prosessointiin käytetyn softan laadusta sekä lähdeaineiston laadusta.

· Vaikka monet paikkatieto-ohjelmat tarjoavat mahdollisuuden on-screen digitointiin, ne eivät usein tarjoa hyviä mahdollisuuksia käsitellä skannattua kuvaa. Siihen on omat ohjelmansa, joilla pystytään esimerkiksi erottelemaan tieverkostot, metsät, vesistöt ym. kohteet omiksi layereikseen värin perusteella.

· Automatic line follower on metodi, jota voidaan käyttää selkeitä viiva-kohteita sisältävien kartta-aineistojen automaattiseen digitointiin.

· Metodi matkii manuaalista digitointia käyttämällä laser- ja valoherkkiä laitteistoja viivojen seuraamiseen.

· Kun skannaamalla saadaan tuotettua rasteriaineistoa, automatic line follower tuottaa vektoriaineistoa.

· Ongelmia saattaa ilmetä, jos lähdeaineiston kartassa on katkeilevia viivoja (esimerkiksi korkeuskäyrissä korkeutta ilmaisevien lukujen kohdalla).

· Kaikkien automaattisten prosessien jälkeen tarvitaan yleensä editointia ja ainakin tuotetun aineiston tarkastamista.

Elektroninen tiedonsiirto

· Verrattuna edellisiin vaihtoehtoihin, jo valmiiksi digitaalisen datan käyttäminen on huomattavasti helpompaa.

· Ongelmallista tiedonsiirrossa saattaa olla lähinnä datan formaatti, jonka on oltava yhteensopiva paikkatietojärjestelmän kanssa.

· Spatiaalista tietoa voidaan kerätä esimerkiksi GPS-laitteilla, elektronisilla etäisyyttä mittaavilla laitteilla ja dataloggereilla.

· Elektronista tiedonsiirtoa voidaan tarvita myös, jos aineistoja tilataan lähteistä, jotka tarjoavat sitä digitaalisessa muodossa (vaikka paitulista).

- TABLE 5.2 sivulla 146 esittelee erilaisia GPS:n tiedostomuotoja. ja BOX 5.4 samalla sivulla kertoo pelastuslaitosten käyttämistä GIS-sovelluksista. BOX 5.5 sivulla 149 esittelee, mistä lähteistä digitaalista dataa voi tilata, millä hinnalla ja missä formaatissa. BOX 5.6 sivuilla 150 esittelee, mistä dataa voi ladata netistä.

Datan editoiminen:

- Oli tilanne mikä tahansa, datassasi tulee todennäköisesti olemaan kuitenkin virheitä joko lähdeaineiston tai editointiprosessin takia. (Käsitellään enemmän kappaleessa 10)

- Datan laatua on valvottava jatkuvasti, jotta uuden datan virheet eivät sotkisi tietokantoja.

- Datan laadunvalvontaa ja editoimista kutsutaan siivoukseksi (cleaning)

Virheiden löytäminen ja korjaaminen

· Atribuuttidatan virheet voidaan jakaa kolmeen ryhmään:

· Koodauksessa aiheutuneet virheet (kirjoitusvirheet ym. inhimilliset.) Koodauksessa aiheutuneita virheitä voit huomata tarkastamalla, onko taulukossa mahdottomia arvoja tai radikaalisti muista arvoista poikkeavia arvoja, jotka kannattaa tarkistaa. Onko taulukko johdonmukainen? Jos taulukko sisältää toistensa kanssa korreloivia arvoja virheitä voidaan etsiä myös tekemällä scattergram-diagrammi. (BOX 5.7 s. 151)

· Virheet lähdeaineistossa (voi olla vaikea havaita)

· Datan siirrosta ja formaatin muutoksesta aiheutuneet virheet

· Spatiaalisen datan virheitä on yleensä vaikeampi löytää ja korjata, kuin ominaisuustiedoissa ilmeneviä virheitä.

· Esimerkkejä virheistä, jotka saattavat aiheutua koodauksesta, erityisesti manuaalisesti digitoidessa:

· Puuttuvat kohteet

· Päällekkäiset kohteet – viiva, raja tai segmentti on digitoitu kaksi kertaa

· Väärin sijoitetut kohteet – viiva, raja tai segmentti on digitoitu väärään paikkaan

· Puuttuvat nimitiedot (labels) – polygoneja ei tunnisteta

· Päällekkäiset nimitiedot – samalla polygonilla useampia tunnisteita

· Digitoinnin artefaktit – Noodit väärässä paikassa, digitoinnissa luuppeja tai piikkejä.

· Kuva 5.11 sivulla 152 kuvastaa digitoinnissa aiheutuneita virheitä.

· Monissa ohjelmissa on mahdollisuus korjata virheet automaattisesti, mutta tällaista ominaisuutta on käytettävä varoen. Esimerkki automaattisesta virheidenkorjauksesta BOX 5.8 sivulla 153.

· Virheitä esiintyy myös rasteridatassa. Yleisiä ongelmia on esimerkiksi puuttuvat kohteet ja noise (väärän värisiä pikseleitä sekaisin aineiston sisällä). Noisea voidaan vähentää tai poistaa filtteröimällä rasteriaineisto (Katso kpl 6).

Uudelleenprojektointi, projektin muuttaminen ja aineistojen generalisoiminen

· On tärkeää huomioida, että uusi data on oikeassa projektiossa. Myös aineiston skaala ja resoluutio kannattaa muuttaa samoiksi tietokannan aikaisemman datan kanssa, ennen kuin dataa yhdistetään vanhaan, tai tehdään analyysejä.

· Kuva 5.15 sivulla 157 osoittaa kuinka paljon eri projektio muuttaa Yhdysvaltain kartan sijoittumista.

· Ison skaalan karttoja kannattaa toisinaan pienentää, jotta niiden käsittely helpottuisi (prosessointiaika ja levytila). Pienentämällä skaalaa, vektoreista poistuu ylimääräisiä pisteitä.

· Kirja esittelee tavan (Douglas-Peucker algoritmi), jolla ylimääräisiä pisteitä voidaan poistaa muuttamatta polygonien muotoa liikaa, sivulla 158 ja kuva 5.16 sivulla 159.

· Rasteriaineistoa voidaan pienentää tai suurentaa joko liittämällä tai jakamalla soluja, joilla on samat arvot. Tämä kuitenkin aiheuttaa usein yksityiskohtien katoamista.

· Sympaattisempi tapa muokata rasteridatan kokoa on käyttää filtteriä (Katso kpl 6).

· Jos suurin tarve on säästää levytilaa, kannattaa data ennen filtteröintiä tai solujen liittämistä mielummin pakata (Katso kpl 3).

Kuvien yhteensovittaminen (Edge matching and rubber sheeting)

· Jos tutkittava alue koostuu kahdesta eri kartasta, ne eivät paikkatieto-ohjelmassa välttämättä vierekkäin asetettuina osu aivan kohdilleen.

· Karttojen yhteensopimattomuus saattaa johtua esimerkiksi eri ihmisten käyttämistä eri kuvioinneista (pattern). Ongelma saattaa tulla vastaan myös satelliittikuvia yhteen sovittaessa, jos kuvat ovat otettu eri aikoihin ja erilaisissa sääolosuhteissa.

· Karttojen yhdistämiseen käytettävää automaattista työkalua kutsutaan termillä edge matching. Prosessi on esitelty kuvassa 5.17 sivulla 160.

· Esimerkiksi ilmakuvauksessa tuotettu kuva-aineisto saattaa olla vääristynyt eri karttalehdillä. Lentokoneen liike ja kameran linssi aiheuttavat vääristymää, joka säilyy datan transformoinnista ja uudelleenprojektoinnista huolimatta. Näitä ongelmia voidaan poistaa tai ainakin lievittää prosessissa, jota kutsutaan nimellä rubber sheeting.

· Rubber sheeting venyttää karttaa eri suuntiin, niin kuin kartta olisi valmistettu kumilevystä (siitä nimi).

· Kartalle jätetään kontrollipisteitä, joiden koordinaatit tiedetään ja väärällä paikalla sijaitsevat tai väärän muotoiset objektit venytetään yhteensopiviksi kontrollipisteisiin.

· Hyviä kontrollipisteitä on huomattavat rakennukset, tiet, joenuomien kohtaamispaikat, vuorenhuiput tai rannikon muodot. Kuvassa 5.18 sivulla 161 on visualisoitu Rubber sheeting –prosessi.

Geokoodaus

· Geokoodaus on prosessi, jossa osoite (tai postinumero ym.) muutetaan sijainniksi (McDonnell ja Kemp, 1998)

· Geokoodausta voidaan tarvita esim. seuraavissa tilanteissa:

· Maantieteilijä: Tutkimuksessa haastateltujen ihmisten sijaintien muuttamisessa kartaksi.

· Pelastuslaitos: Onnettomuuspaikan tunnistamisessa, todistajan antamien yksityiskohtien perusteella.

· Markkinointi: Rekisterin perustaminen esimerkiksi tietyn kaupan etukortin haltijoista, joille mainontaa voidaan täsmentää.

Päivittäminen ja alueellisten tietokantojen ylläpito

· Maailma on dynaaminen paikka jossa asiat muuttuvat usein nopeaa vauhtia, etenkin kaupunkialueilla, jonne rakennetaan jatkuvasti uusia taloja ja teitä. Tämä tarkoittaa sitä, että paikkatieto vanhenee nopeasti ja tarvitsee ylläpitoa.

· Paikkatiedon päivittäminen vaatii usein kenttätyötä, jossa työvälineenä käytetään kannettavia tietokoneita ja GPS-laitteita (Katso esimerkki BOX 5.9 sivulla 162).

Kohti integroitua tietokantaa:

- Kuten kappaleessa 3 on osoitettu, GIS on kerroksellisesti rakennettu kuva todellisuudesta.

- Jokainen kerros tietokannassa on koodattava, korjattava ja muokattava, jotta saadaan aikaan analyysiin kelpaavaa geoinformaatiota.

- Boksissa 5.10 sivulla 164 on hypoteettinen esimerkki (todellisuudessa samat asiat voidaan hoitaa hyvin monella eri tavalla) siitä, kuinka integroitu tietokanta voisi olla perustettu käytännössä.

Kappale 6

Data-analyysi

Kappaleen tavoitteena on esitellä toimintoja (functions) datan analysoimiseen, tarjota esimerkkejä siitä, miten näitä toimintoja käytetään ja kertoa ongelmista joita data-analyysissa esiintyy.

Mittaukset GIS:ssä: pituudet, ympärysmitat ja pinta-alat

Pituuden mittaaminen digitaaliselta kartalta on suhteellisen yksinkertainen toimitus. On kuitenkin mahdollista, että mittaustulos vaihtelee riippuen paikkatiedon tyypistä (rasteri tai vektori) tai käytetystä mittaustavasta. On tärkeää muistaa, että kaikki mittaustulokset GIS:ssä ovat epätarkkoja, koska paikkatieto on aina yleistetty esitys todellisuudesta (esim. vektoridatan tapauksessa käyrältä näyttävä viiva on itse asiassa kokoelma lyhyitä suoria viivoja).

Rasteridatan tapauksessa pituus voidaan mitata kolmella tavalla. Yleensä vedetään suora viiva mittauspisteiden välille ja muodostetaan suorakulmainen kolmio, jolloin Pythagoraan lauseella voidaan laskea etäisyys pisteiden välilä. Ns. Manhattan-etäisyys saadaan, kun kuljetaan alkupisteestä loppupisteeseen seuraamalla rasterisolujen (vrt. kortteleiden) sivuja. Nimensä tämä metodi on saanut kulkutavasta, jota on pakko käyttää Manhattanin kaltaisissa ruutukaava-kaupungeissa. Kolmannessa metodissa käytetään konsentrisia vyöhykkeitä, jotka ovat kukin tietyllä etäisyydellä alkupisteestä. Näin muodostuva kuva näyttää lyhyimmän etäisyyden jokaisesta kartan pisteestä (ml. loppupisteen) alkupisteeseen.

Ympärysmitta lasketaan rasteridatan tapauksessa kertomalla alueen muodostavien solujen sivujen lukumäärä rasteriruudukon resoluutiolla. Pinta-ala saadaan yksinkertaisesti kertomalla alueen solujen määrä yksittäisen solun pinta-alalla. Pinta-ala- ja ympärysmittalaskelmiin vaikuttaa rasteridataa käytettääessä solukoko, datan alkuperä ja ruudukon suuntaus (tulisi käyttää pohjois-etelä -suuntaisia ruudukoita).

Vektoridatankin tapauksessa etäisyys lasketaan Pythagoraan lauseella. Ympärysmitta on lyhyiden suorien viivojen summa, ja pinta-ala lasketaan yhdistämällä yksinkertaisten geometristen kuvioiden (joihin alue on jaettu) pinta-alat.

Kyselyt (queries)

Kyselyjen tekeminen on olennainen osa GIS-työskentelyä. Ne ovat hyödyllisiä kaikilla paikkatietoanalyysin tasoilla tiedon hankkimisessa sekä käytetyn datan ja saatujen tulosten laadun tarkistamisessa.

Kyselyjä on kahta tyyppiä: spatiaalinen ja aspatiaalinen. Aspatiaaliset kyselyt koskevat ominaisuuksia, joihin sijainnilla ei ole merkitystä, esim. "Kuinka moni rakennuksista on kaksikerroksinen?". Kun kysytään "Missä kaksikerroksiset rakennukset sijaitsevat?", on kyseessä spatiaalinen kysely. Spatiaalisen kyselyn tulokset voidaan esittää kartalla.

Yksittäisiä kyselyjä voidaan yhdistää, kun halutaan tuloksia jotka täyttävät useita kriteerejä, esim. "Missä sijaitsevat kaksikerroksiset rakennukset, joissa on uima-allas?". Tällöin käytetään Boolean-operaattoreita (AND, NOT, OR) kysymysten yhdistämiseen.

Uudelleenluokittelu (reclassification)

Uudelleenluokittelua voidaan käyttää kyselyjen asemesta, jos käytössä on rasteridataa. Oletetaan, että meillä on ilmakuva maankäytöstä. Haluamme tietää, missä kuvan alueella on metsää. Alkuperäisessä kuvassa metsää esittävillä soluilla (pikseleillä) oli arvo 10. Uudelleenluokittelemme arvot niin, että

Ne solut, joiden arvo on 10, saavat uuden arvon 1

Ne solut, joiden arvo on jokin muu kuin 10, saavat arvon 0

Tuloksena on kuva, jossa metsäalueet on koodattu arvolla 1 ja kaikki muut alueet arvolla 0. Monimutkaisesta alkuperäisestä kuvasta muodostettu yksinkertainen kaksiarvoinen (kaksivärinen) kuva on hyödyllinen, kun analyysia halutaan jatkaa pidemmälle.

Puskurointi ja naapurustofunktiot (Buffering and neighbourhood functions)

Bufferoinnissa pisteen, viivan tai polygonin ympärille muodostetaan halutun suuruinen vyöhyke tai vyöhykkeitä, joita voidaan sitten hyödyntää esimerkiksi etsittäessä vastausta kysymykseen "Mitkä hotellit sijaitsevat 200 metrin päässä päätiestä?". Vastaus voitaisiin selvittää myös niin, että mitattaisiin etäisyys jokaisesta hotellista päätielle, jotta saataisiin selville, mitkä hotellit sijaitsevat alle 200 metrin päässä tiestä. GIS -analyysissa onkin lähes aina useampi kuin yksi tapa selvittää vastaus kysymykseen. Juju on siinä, että löytää nopeimman ja tehokkaimman menetelmän.

Vektoridatalla puskurivyöhykkeet muodostetaan yhdellä yksinkertaisella komennolla, mutta rasteridatan tapauksessa käytetään erilaista lähestymistapaa, lasketaan "läheisyys" (proximity). Jokaiselle solulle lasketaan ominaisuusarvoksi eli attribuutiksi sen etäisyys halutusta pisteestä (esim. hotellista). Tuloksena on kartta, jossa etäisyys pisteestä näkyy solun värin vaihtumisena esim. punaisesta (lähin) siniseen (kauimmaisin).

Operaatioita, joissa rasteridatan solujen arvot muuttuvat vierekkäisten solujen arvojen perusteella, kutsutaan naapurustofunktioiksi. Suodattaminen (filtering) on naapurustofunktio, jossa kohdesolun arvo muuttuu sitä reunustavien solujen ominaisuuksien perusteella. Suodatin on muodoltaan neliö tai ympyrä, ja sen koko määrittää suodatettavien naapurisolujen määrän. Suodattimella käsitellään rasteriaineisto ja tuloksena saadaan esimerkiksi laitteiston vian vuoksi epätasalaatuisesta rasterisatelliittikuvasta helpommin luettava kuva.

Datan yhdistäminen - overlay-analyysi

Monen samaa aluetta kuvaavan teemakartan päällekkäin asettaminen eli overlay-analyysi on ehkä tärkein kaikista GIS -analyyseista ja sen periaate on varmaankin kaikille tuttu. Esimerkiksi kysymykseen "Mitkä hotellit sijaitsevat 200 metrin päässä päätiestä?" saadaan overlaylla vastaus niin, että ensin bufferoidaan päätie 200 metrin etäisyydeltä. Tämän jälkeen bufferi-layerin päälle tuodaan layer, johon on merkitty alueen hotellit. Näistä kahdesta layerista saadaan yksi layer, josta nähdään mitkä hotellit sijaitsevat 200 metrin päässä tiestä.

Kuten monen muunkin operaation ja analyysin kohdalla, myös overlayn tapauksessa on eroa siinä, tehdäänkö analyysi rasteri- vai vektoridatalla. Vektoridatalla overlay-analyysi on aikaavievää, monimutkaista ja laskentatehoa vaativaa, koska pisteet, viivat ja polygonit muodostavat monimutkaista geometriaa, kun monia kerroksia asetetaan päällekkäin ja dataa on paljon. Rasteridatalla tilanne on täysin päinvastainen: overlay-analyysi on nopea ja tehokas. Vektori-o