web viewmmpi antoi huomattavasti vähemmän vääriä tuloksia mutta niitä...

70
GOAL ATTAINMENT SCALING: Applications, Theory, And Measurement Edited by Thomas J. Kirsesuk Aaron Smith Joseph E. Cardillo LAWRENCE ERLBAUM ASSOCIATES, PUBLISHERS Hills, New Jersey, Hove and London 1994 Referaatti Kari Hannonen

Upload: phamliem

Post on 04-Feb-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

GOAL ATTAINMENT SCALING:

Applications, Theory, And Measurement

Edited by

Thomas J. Kirsesuk

Aaron Smith

Joseph E. Cardillo

LAWRENCE ERLBAUM ASSOCIATES, PUBLISHERS

Hills, New Jersey, Hove and London 1994

Referaatti

Kari Hannonen

2009

2

1. Esipuhe ja yleiskatsaus (ss. 1 – 14)

(Aaron Smith)

Kirjan alkuluvussa Aaron Smith esittelee lyhyesti Goal Attainment Scalingin (GAS) taustan, lähtökohdat, menetelmän käyttöön tarvittavan koulutuksen ja perehdytyksen yleispiirteittäin ja antaa perusohjeet GAS:n skaalojen rakentamiseen ja arviointiin. Lisäksi Smith tuo esille tyypilliset virheet, joita GAS:ia käytettäessä on syytä välttää.

Smithin kertoo, että GAS on kehitetty alun perin mielenterveyspotilaiden hoidon tulosten arviointiin mutta se on myöhemmin hyväksytty laajalti myös muissa sosiaali- ja terveyspalveluissa (human service programs). Sen erityisenä vahvuutena on muutoksen arviointi, jonka takia sen sovelluksia on käytetty kasvatuksen, kuntoutuksen, lääketieteen, vankeinhoidon, hoito- ja sosiaalityön ja riippuvuuksien hoidon tulosten arvioinnissa. Menetelmä on herättänyt kiinnostusta siksi, että sen avulla on mahdollista mitata tuloksia yksilöllisestä näkökulmasta. GAS edellyttää yksilöille, ryhmille tai organisaatioille räätälöityjen, tuloksia arvioivien asteikkojen laatimista. Näin se arvioi muutosta yksilön tai ryhmän tasolla kohdennettuna niihin ongelmiin, joihin on tarkoitus saada muutoksia aikaan. Esimerkiksi (ilm.) USA:ssa käytetty suppea psykiatrinen arviointiasteikko (Brief Psyciatric Rating Scale) arvioi kaikkia potilaita samalla 18 kriteerin sarjalla – yksilöllisten haastatteluiden perusteella kullakin potilaalla on yleisesti ottaen korkeat arvot vain 4 – 5 kriteerillä. Hoidon tulosten arviointi voi tällaisella mittarilla vääristyä, koska tavoitteisiin päästään ja on mahdollista sekä järkevää päästä vain joillakin mittarin osa-alueilla. Lisäksi sen perusteella saattaa jäädä mittaamatta ongelmia, joiden perusteella potilas on alun perin tullut hoitoon. Esimerkiksi mielenterveyspotilaiden ongelmien moninaisuuden vuoksi ei ole Smithin mielestä järkevää käyttää standardimittareita mittaamaan hoidon vaikutuksia. GAS kiinnittää huomion niihin ongelmiin jotka palveluntarjoaja – yleensä yhteistyössä potilaan kanssa – katsoo tärkeimmiksi toipumisen kannalta. Nämä arvioitaviksi valikoidut tavoitteet luovat kehyksen tavoitellulle muutokselle, johon hoito kohdennetaan.

Vaikka useimmat hoidot tähtäävät suoraan tai epäsuorasti muutokseen, ei niiden päämääriä useinkaan tuoda selkeästi esille. Voi olla lisäksi niin, että asiakkaiden tai potilaiden kanssa ei päästä yksimielisyyteen siitä, mitä on tarkoitus muuttaa. GAS ei pelkästään palvele hoidon kohdentamista ja tavoitteiden asettelua – se voi tuomalla tavoitteet avoimesti esille myös ohjata ja kohdentaa saatavilla olevan tuen tavoitteiden saavuttamiseen. Selkeästi määritellyt, terapeutin ja terapoitavan yhdessä asettamat tavoitteet, jotka jaetaan myös muun henkilökunnan kanssa, suuntaavat hoitotoimet yhteisen päämäärän saavuttamiseen. Smith toteaa, että useat tutkimukset viittaavat myös siihen, että jo tavoitteiden asettaminen sinänsä voi saada aikaan suotuisia tuloksia. Smithin mukaan mahdollisia terapeuttisia hyötyjä mielenterveystyössä voivat olla mm:

1. terapeutin käsitteellisen ongelmien ymmärtämisen ja hoidon suunnittelun paraneminen2. potilaan ja terapeutin käsityksen selkeytyminen hoidon tavoitteista3. potilaan omien ongelmanratkaisukeinojen käyttöönotto4. realististen hoidon tavoitteiden ja vaikutusten odotusten määrittely5. potilaan lisääntynyt tyytyväisyys tuloksiin6. terapian lisääntynyt päämäärätietoisuus7. potilaan ja henkilökunnan lisääntynyt yhteistyö ja yksimielisyys

3

8. tavoitteiden asettamisen aikaansaama potilaan lisääntynyt motivaatio saada aikaan muutoksia9. terapian parantuneet tulokset, eli lisääntynyt tavoitteiden saavuttaminen.

GAS on erityisen käyttökelpoinen mittari muutoksen mittaamisessa. Sitä ei voi kuitenkaan pitää tulosten mittaamisen ihmelääkkeenä, koska se ai anna tietoa yksilön suhteellisesta muutoksesta verrattuna vaikkapa valtakunnalliseen tasoon. Yksilötasolla voi tapahtua suuriakin muutoksia mutta vaikkapa lähtötason oltua erityisen matala, voi tulos olla vielä suhteellisen huono verrattuna muihin samassa hoidossa olleisiin. Toisaalta potilaan hoidon jälkeinen hyvä suhteellinen tilanne voi olla seurausta myös hyvästä lähtötasosta.

GAS:in toteuttaminen onnistuu vain riittävästi koulutetuilta ammattilaisilta. Esimerkiksi mielenterveyspotilaiden kanssa ainoastaan mielenterveysalan ammattilaisten on mahdollista laatia hoidon tavoitteiden kannalta sopivat tavoitteet ja luoda niiden arvioimiseksi toimivat asteikot. GAS:in käyttöön riittävä koulutus vaihtelee sovellusalan mukaan. Sovellusaloilla, joilla tavoitteet on mahdollista kuvata ja mitata helposti, tarvitaan lyhyimmät koulutukset. Vastaavasti sovellusaloilla, jolla tavoitteet ovat hankalasti määriteltäviä tai niistä on vaikea päästä yhteisymmärrykseen, koulutus on vaativampaa. Mielenterveyspalvelut, joita varten GAS alun perin kehitettiin, ovat vaikeimpien sovellusalojen joukossa mm. siksi, että terapeuteilla on eri viitekehyksiä. Käyttökoulutukseen tarvittava aika on keskimäärin 14 tuntia, johon sisältyy käytännön harjoittelu. Lisäksi kouluttajalta tarvitaan 6 tunnin panostus kutakin koulutettavaa varten. Koulutuksissa on huomattu, että opiskelijan kannattaa mahdollisimman pian siirtyä laatimaan tavoitteita, niiden arviointiasteikkoja ja arvioimaan tuloksia. Koulutus on varsin käsityömäistä, koska siihen tarvitaan huomattava ohjaajan panostus.

Smithin (ss. 7 – 9) ohjeiden mukaan tavoitteiden skaalaus toteutetaan seuraavasti:

1. Tunnista ongelmat, joihin pyritään vaikuttamaan. Asiakkaalla voi olla useita havaittavia ongelmia, joista on valittava ne, jotka ovat keskeisiä. GAS keskittyy vain niihin ongelmiin, oireisiin tai asioihin, joiden toivotaan muuttuvan.

2. Muotoile valituista ongelmista ainakin kolme päämäärää/tavoitetta. Sen sijaan, että keskityttäisiin ongelmiin ja oireisiin, GAS tarjoaa mahdollisuuden olla myönteinen ja etsiä yhdessä asiakkaan kanssa päämääriä, eikä pohtia asioita, jotka ovat huonosti. Tavoitteet voivat olla vaihtelevia (toimintaan, tunteisiin ja ajatuksiin liittyviä) sillä edellytyksellä, että niiden saavuttamista on mahdollista arvioida seurantahaastattelussa.

3. Valitse jokaiselle tavoitteelle lyhyt nimi. Tavoitteiden asettaja valitsee lyhyen sanallisen kuvauksen joka välittää tavoitteen sisällön. Tavoite voi olla esimerkiksi ahdistuskohtausten vähentäminen, vihamielisyyden vähentäminen, ystävien etsiminen tai rahan säästäminen.

4. Valitse kullekin tavoitteelle mittari. Mittari on käyttäytyminen, tunnetila, taito tai prosessi, joka parhaiten kuvaa tavoitetta ja jota voidaan käyttää tavoitteen saavuttamisen kuvauksena. Jos yksi tavoite on esimerkiksi masentuneisuuden vähentäminen, voidaan mittareita etsiä vaikkapa seuraavasta listasta: itkeminen (tiheys ja kesto), itsemurha-ajatukset (määrä), eristäytyminen (aste), kontrolli omiin reaktioihin eri tilanteissa, näkemys tulevaisuudesta, avuttomuuden tunteet, painon väheneminen, alakuloinen mieliala, itsetunto, unihäiriöt.

5. Määrittele tavoitteelle halutun tuloksen taso. Tämä on useimmiten GAS:ia käytettäessä hankalin tehtävä, koska siinä on pystyttävä arvioimaan valitun tavoitteen saavutettavissa oleva taso hoidon loppuessa. Tällöin tavoitteen laatijalla tulee olla hyvä käsitys hoidon yleisistä mahdollisuuksista, asiakkaan resursseista, käytettävissä olevasta ajasta ja omasta osaamisestaan. Määrittely voidaan tehdä käyttämällä mittarina tapahtuman esiintymistä, prosenttia ajasta tai voimakkuutta tai

4

vaihtoehtoisesti voidaan laatia laadullinen kuvaus tilanteesta, vaikkapa potilaan kyvystä kontrolloida hallusinaatioita. Lisäksi, koska tuloksen täydellinen ennustaminen on mahdotonta, on viisainta asettaa vaihteluväli, jonka puitteissa tulosta arvioidaan. Tuloksena täytyy kuitenkin olla mahdollisimman tarkka odotetun tuloksen kuvaus.

6. Tarkista halutun tuloksen taso. Ovatko mittari ja odotettu tulos yhdenmukaiset tavoitteen nimen kanssa? Onko ulkopuolisen arvioijan mahdollista ymmärtää mitä tavoitellaan? Millä tavoilla arvioijan on mahdollista tarkistaa tavoitteen saavuttamisen aste?

7. Määrittele hieman enemmän ja hieman vähemmän –tasot verrattuina tavoitetasoon. Kun odotettu tulos on määritelty, voidaan asettaa tasot myös välittömästi tavoitetason lähellä olevilla muutoksille. Kummankin täytyy olla realistisesti saavutettavissa olevia tasoja.

8. Määrittele paljon enemmän ja paljon vähemmän –tasot verrattuina tavoitetasoon. Nämä tasot edustavat saavutettavissa olevia rajoja kunkin asiakkaan tavoitteille. Vastaavanlaisilla asiakkailla 5 – 10 % osuus voi asettua näille tasoille.

9. Toista samat skaalausaskeleet kullekin asetettavalle tavoitteelle. Jokaisen tavoitteen skaalassa täytyy olla viisi odotetun tuloksen tasoa – yhtään tasoa ei saa jättää väliin.

Smith toteaa, että tavoitteiden skaalauksessa esiintyy toistuvasti muutamia huomioon otettavia ongelmia. Ammattislangin tai teknisen jargonin käyttö hankaloittaa tulosten arviointia. Tavoitteet saatetaan laatia myös epämääräisiksi, joka sekin hankaloittaa arviointia. Skaalojen tasot saattavat olla päällekkäisiä tai niiden välille jää aukkoja. Skaaloista voi tulla myös monitasoisia tai tasoja saattaa jäädä kuvaamatta. Pulmia saattaa tulla myös kirjoitusvirheistä, aikamääreistä tai seurantatiedon lähteiden määrittelystä. Jos näitä virheitä tietoisesti pyritään välttämään ensimmäisiä asteikkoja laadittaessa, tulee Smithin arvion mukaan hyvistä tavoitteidenasettelukäytännöistä nopeasti lähes automaattisia.

Mielenterveyspalveluissa tavoitteita asettavat ammattilaiset, joko yksin tai yhteistyössä potilaiden kanssa, tai joskus myös potilaat yksin. Tutkimustieto ja käytännön kokemus viittaavat Smithin mielestä siihen, että potilaan mukana olo tavoitteita asetettaessa antaa paremman tuloksen kuin ammattilaisten yksin laatimat tavoitteet. Tavoitteita asettavan ammattilaisen täytyy olla riittävän kokenut, ja yleensä edellytetään vähintään vuoden mittaista kokemusta kliinisestä työstä muodollisen koulutuksen lisäksi, jotta tavoitteista tulisi realistisia ja toteutettavissa olevia. Erityisen tärkeänä ehtona GAS:n käytölle voidaan pitää sitä, että asetettavat tavoitteet ovat merkityksellisiä hoidettavien ongelmien kannalta. Tavoitteiden mielekkyyteen ja niiden saavutettavuuteen on kiinnitettävä erityistä huomiota, jotta tulokset heijastavat hoidon tuloksia. Jos tavoitteet eivät ole mielekkäitä, voidaan potilaan saavuttamat tulokset arvioida liian korkeiksi tai liian alhaisiksi.

Säännöllinen monitorointi eli laadunvalvonta on tarpeellista, jotta mahdollisimman hyvin voidaan seurata tavoitteidenasettelijan kykyä asettaa tavoitteita ja tarvittaessa ohjata jatkokoulutukseen sellaisia henkilöitä, joiden tulokset ovat säännönmukaisesti liian alhaisia tai liian korkeita. Useimmissa sovelluksissa seurantahaastattelut on tehty hoidon päätteeksi, ennalta sovittuna ajankohtana ja joissakin tapauksissa määrätyn ajan kuluttua hoidon päättymisestä.

5

2. Esimerkkejä tavoitteiden asettelusta (ss. 15 – 37)

( Joseph E. Cardillo ja Robert O. Choate)

Cardillo ja Choate tarkentavat Smithin kirjan alkuluvussa esittelemää tavoitteiden skaalausta tuomalle esille skaalauksen käyttöä esimerkkien valossa eri tilanteissa. Lisäksi he esittelevät GAS:n käytössä esille tulevia ongelmia ja yleisimpiä kysymyksiä, joita skaalojen käytössä nousee esille. Luvun keskeinen ajatus on tuoda esille GAS:in arviointitaulukon (Follow-Up Guide) laatiminen eri asiakkaille. Cardillon ja Choaten esittämät säännöt eivät ole ehdottomia sääntöjä, mutta niitä noudattamalla on mahdollista välttää ongelmia GAS:n käytössä. Heidän mukaansa GAS:n käytön minimivaatimukset ovat seuraavat:

a) viiden uskottavan ja pisteytettävän tavoitetason määrittelyb) tasojen määrittely Kiresukin ja Shermanin (1968) esittämällä tavalla jac) kriteerien määritteleminen ennalta kunkin tason pisteyttämistä varten. Ennalta määritteleminen

tarkoittaa tässä yhteydessä sitä, että kriteerit kunkin tason pisteyttämiselle on asetettava silloin, kun asteikkoa laaditaan eikä seurantavaiheessa.

Ensimmäinen esimerkki otetaan mielenterveyspalveluiden asiakkaasta. Kyseessä on 32-vuotias mies, joka on vapautunut hiljattain vankilasta suoritettuaan vuoden tuomion rattijuopumuksesta ja liikenneturvan vaarantamisesta. Mielenterveystyöntekijän haastattelun perusteella taustalla on epäsäännöllisistä työsuhteista koostuva 14 vuoden mittainen työhistoria. Asiakas on koulutodistusten perusteella lahjakas mutta alisuorittaja, päällisin puolin hyvin käyttäytyvä henkilö, joka on aina onnistunut löytämään työtä suuremmitta ongelmitta. Haastattelussa terapeutti havaitsi, että asiakas tuntee itsensä äärimmäisen epävarmaksi ja turvattomaksi, häneltä puuttuu itseluottamus lähes tyystin, ja epäonnistumisiin hän etsii syyllisiä muualta kuin itsestään. Riittämättömyyden tunteet purkautuvat voimakkaina raivokohtauksina, joita päihteidenkäyttö kärjistää. Yhteisymmärryksessä tavoitteiksi valitaan:

skaala/tavoite 1 skaala/tavoite2 skaala/tavoite3

Urasuunnitelman löytäminen Vihan kontrollointi Itsetunto

Kun tavoitteet on valittu, rakennetaan kullekin tavoitteelle mittarit.

Urasuunnitelman löytäminen: Taso, jolla asiakas on onnistunut laatimaan tai toteuttamaan tyydyttävän urasuunnitelman.

Vihan kontrollointi: Prosenttimäärä tilanteissa, joissa asiakas on onnistunut kontrolloimaan vihaansa provosoivissa tilanteissa.

Itsetunto: Määrä, jolla asiakas ajattelee itsestään myönteisesti verrattuna kielteisiin ajatuksiin.

Cardillon ja Choatesin mukaan erityisesti kokemattomille tavoitteiden asettajille vaikeinta GAS:in käytössä on tavoitetason määrittely. Siinä täytyy ottaa huomioon mm. asiakkaan lähtötilanne, motivaatio, elämäntilanne, tarjolla oleva tuki jne. Esimerkkitapauksessa tavoitteet asetettiin siten, että arvioitiin aloitettavan terapian avulla saavutettavissa oleva todennäköinen lopputulos sen sijaan, että olisi arvioitu

6

asiakkaan toiveita tai asiakkaan kannalta miellyttävintä lopputulosta. Tässä tapauksessa tavoitteet kirjattiin taulukkoon (Goal Attainement Follow-up Guide) seuraavasti:

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Urasuunnittelu

Skaala 2 Vihan hallinta

Skaala 3Itsetunto

Paljon vähemmän -2 kuin odotettiin

Ei ole valinnut yhtään urasuunnitelmaa.

Vähemmän kuin 25 % ajasta.

Enimmäkseen kielteisiä piirteitä (tuntee itsensä arvottomaksi).

Hieman vähemmän -1 kuin odotettiin

Yksi tai useampi urasuunnitelma valittuna mutta ei suunnitelmaa.

Vähintään 25 % ajasta. Enemmän kielteisiä kuin myönteisiä piirteitä.

Tavoite on toteutunut 0odotetulla tavalla

On valinnut yhden tai useampia urasuunnitelmia ja laatinut suunnitelman sen/niiden toteuttamiseksi.

On pystynyt hallitsemaan vihan tunteita vähintään 50 % ajasta viimeisen kahden viikon aikana (oma arvio).

Tuntee, että kielteisiä ja myönteisiä piirteitä on saman verran.

Hieman enemmän +1 kuin odotettiin

On toteuttanut suunnitelmaa (esim. työhaastattelu).

Vähintään 65 % ajasta. Enemmän myönteisiä kuin kielteisiä piirteitä.

Paljon enemmän +2 kuin odotettiin

On saanut työtä haluamallaan alalla.

Vähintään 85 % ajasta. Enimmäkseen myönteinen kuva itsestä.

Huomautukset

Cardillo ja Choates toteavat, että odotetun tuloksen määrittely ensimmäiseksi helpottaa muiden tasojen määrittelyä. Skaalan laatijan kokemus samantyyppisistä asiakkaista tulee esille enemmän ja vähemmän –tasojen asettamisessa. Paljon enemmän ja paljon vähemmän –tasojen saavuttamisen mahdollisuuden pitäisi olla arviolta 10%.

Program Evaluation Recource Center in Minneapolis on kehittänyt yksinkertaisen tarkistuslistan, jolla skaalauksen pisteytyksen sujuvuus on helppo tarkistaa:

1. Onko kussakin skaalassa ainoastaan yksi muuttuja?2. Onko kaikki vaihtoehdot otettu huomioon?3. Onko joku lomakkeen solu jäänyt tyhjäksi?4. Onko päällekkäisiä tasoja?5. Onko tasojen välillä aukkoja?6. Onko käytetty lyhenteitä tai ammattitermejä?

7

Myös arviointiajankohta on ehdottomasti määriteltävä selkeästi. Samoin on varmistettava, että arvioija tietää mistä arvioinnissa tarvittava tieto on saatavissa. Mikäli arvioinnissa on tarpeen ottaa huomioon erityisiä ehtoja, on ne ilmoitettava seurantataulukossa selkeästi.

Toinen esimerkki kuvaa geriatrista kuntoutusta. Tässä 72-vuotiaan miehen tavoitteet määriteltiin oikeanpuoleisen aivohalvauksen jälkeen seuraavasti:

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Fysioterapia:Liikkuminen

Skaala 2 Toimintaterapia:Käsivoima

Skaala 3Psykologia:Sosiaalisuus

Paljon vähemmän -2 kuin odotettiin

Pystyy kävelemään vähemmän kuin 50 jalkaa lepäämättä kävelykepin tai rollaattorin avulla; pidemmillä matkoilla liikkuu pyörätuolissa.

Vähemmän kuin 50 paunaa.

Pysyttelee huoneessaan lukuun ottamatta aterioita ja hoitoja, ei keskustele toisten kanssa.

Hieman vähemmän -1 kuin odotettiin

Pystyy kävelemään 50 jalkaa tai enemmän lepäämättä kävelykepin tai rollaattorin avulla.

50 paunaa tai enemmän. Lähtee satunnaisesti huoneen ulkopuolelle muulloinkin kuin tarpeen vuoksi mutta ei ota sosiaalista kontaktia.

Tavoite on toteutunut 0odotetulla tavalla

Pystyy kävelemään 100 jalkaa tai enemmän joko kävelykepin tai rollaattorin avulla.

Vasemman käden ote (grip strength) 60 paunaa tai enemmän.

Seurustelee huoneen ulkopuolella, jos joku tekee aloitteen mutta ei yleensä ole itse aloitteeellinen.

Hieman enemmän +1 kuin odotettiin

Pystyy kävelemään 200 jalkaa tai enemmän kävelykepin tai rollaattorin avulla.

70 paunaa tai enemmän. Aloittaa joskus keskustelun huoneen ulkopuolella.

Paljon enemmän +2 kuin odotettiin

Pystyy kävelemään 200 jalkaa tai enemmän kävelykepin tai rollaattorin avulla ja kävelee lyhyitä matkoja ilman tukea.

80 paunaa tai enemmän. Ottaa osaa sosiaalisiin ryhmätoimintoihin hoitopaikassa (tai kotona)tai ulkopuolella.

Huomautukset Mitataan dynamometrillä.

Alkuluvussakin kuvattujen tavallisimpien skaalojen laatimisen ongelmien – huolimattomuus- ja epätarkkuusvirheiden, skaalojen jatkuvuuden (aukot skaalojen välillä tai päällekkäiset skaalat tai moniulotteiset skaalat) ja skaalojen jättäminen tyhjiksi, Cardillo ja Choate kiinnittävät huomiota skaalojen epämääräisyyteen. Sekava, hämärä, epätäydellinen tai tulkinnanvarainen termistö hankaloittaa tulosten arviointia. Tämä on yleensä erityisesti aloittelevien tavoitteenasettelijoiden ongelma. Esimerkiksi voidaan asettaa tavoitteeksi, että potilas ratkaisee riidat vaimon kanssa. Seurantahetkellä osa riidoista saattaa olla

8

ratkenneita mutta osa ei. Samoin epämääräiset termit kuten parantunut, huonontunut, parempi, huonompi, enemmän, vähemmän, onnellisempi, ovat vaikeita arvioitavia.

Merkittävä ongelma on myös prosessin ja tuloksen erottaminen skaalojen laatimisessa. GAS:ssa on tarkoitus skaalata tuloksia, ei keinoja tulosten saavuttamiseksi. Toisaalta tavoitteiden saavuttamisen prosessi saattaa toisessa yhteydessä olla loogisesti tulkittavissa myös tulokseksi. Esimerkiksi masentuneen asiakkaan hoidossa osallistuminen ryhmäterapiaan voidaan tulkita keinoksi tavoitteen saavuttamiseksi (esim. itsemurha-ajatusten vähentäminen). Toisaalta, jos asiakas on taipuvainen eristäytymään, voi säännöllinen osallistuminen olla tulkittavissa myös tavoitteeksi. Ratkaisuna tähän pulmaan Cardillo ja Choate esittävät, että GAS-skaalojen laatimisessa prosesseja voidaan määritellä tavoitteiksi silloin, kun niitä voidaan pitää asioina, joita on tarpeen saavuttaa tai saada aikaan (…” if they can be considered ’that which is to be achieved or realized’”.

Lopuksi Cardillo ja Choates huomauttavat, että asiakkaiden itsearviointiin – vaikka sitä käytetään yleisesti eri hoito-ohjelmien tulosten, myös GAS:n arvioinnissa – liittyy metodologisia ongelmia. Erityisesti subjektiiviset erot arvioinnissa voivat nousta esille vaikkapa numeroasteikkoja käytettäessä. Vaikkapa asteikko 1 – 10 kivun, ahdistuksen, masennuksen tai muiden kokemusten arvioinnissa voi olla ongelmallinen sikäli, että kunkin numeron arvo voi vaihdella eri aikoina ja eri tilanteissa – vaikkapa asteikolla arvioitavan tunteen vaihdellessa. Kirjoittajat suosittelevat ratkaisuna suoraa muutoksen arviointia – numeroarvoja tai ”pientä/huomattavaa parannusta” jne. – ja skaalojen arvojen kiinnittämistä käyttäytymiseen tai muuhun aineistoon, joka on asiakkaalle merkityksellistä ja pisteyttäjän helposti arvioitavissa.

3. Tavoitteiden asettaminen ja tulosten seuranta (ss. 39 – 59)

Joseph E. Cardillo

3.1. GAS:n kliininen käyttö

Luvussa Cardillo pyrkii tuomaan esille näkökohtia, joiden perusteella GAS:n käyttäjät pystyvät tekemään valintoja sen käytöstä eri tilanteissa. GAS:n käytössä on otettava huomioon mm. se, kuka vastaa tavoitteiden asettelusta, kuka seuraa tavoitteiden saavuttamista, kuinka tavoitteiden saavuttaminen pisteytetään, onko asiakas mukana tavoitteiden asettelussa ja arvioinnissa, kuinka tavoitteet skaalataan realistisesti niin, että ne ovat asiakkaan kannalta järkeviä jne. Cardillo toteaa myös, että vaikka hän erottaakin kliiniset sovellukset tutkimuksellisesta käytöstä, ei ole välttämättä helppoa tai tarpeellistakaan käytännössä erottaa näitä toisistaan.

Yksi ensimmäisistä missä tahansa yhteydessä tehtävistä päätöksistä on se, että kuka tavoitteet määrittelee. Ilmeisimmissäkin tilanteissa (esimerkiksi erityisopettaja, joka määrittelee yksilöllisiä tavoitteita oppilaalle) on olemassa useita mahdollisuuksia. Opettaja voi asettaa tavoitteet itse tai ottaa myös oppilaat mukaan tavoitteita määrittelemään. Psykiatri voi samoin asettaa tavoitteet itse, ottaa potilaan mukaan tai

9

neuvotella omaisten kanssa ja antaa potilaan määritellä tavoitteet itsenäisesti. Pulma ei näin ollen olekaan siinä kuka pystyy määrittelemään tavoitteita, vaan kenen tämä on järkevää tehdä. Tähän päätökseen vaikuttavat erityisesti käyttöyhteys, toiminnan yleinen päämäärä ja saatavilla olevat resurssit. Tavoitteiden asettajan valinta on Cardillon mielestä GAS:n käytön kannalta tärkein päätös, joka vaikuttaa tulosten tulkintaan ja luotettavuuteen merkittävästi. Cardillo pohtii vaihtoehtoja sekä kliinisissä yhteydessä että tutkimuskäytössä, vaikkakaan näiden erottelu ei käytännössä ole hänestä selkeää tai välttämätöntäkään

Kliinisessä työssä käytettäessä GAS:n etuja on kuvattu jo alkuluvussa. Keskeinen kysymys Cardillon mukaan tässä yhteydessä on asiakkaan ja terapeutin osuus tavoitteiden asettelussa. Terapeutin rooli on tärkeä siitä syystä, että hänellä on hallussaan tieto intervention toteuttamisesta ja yleisistä mahdollisuuksista saada aikaan muutosta. Vaikka tavoitteiden asettelu on työlästä ja lisää kustannusta, sen myötä tulee säästöä sekä dokumentaatiossa että hoidon suunnittelussa.

Kun asiakas määrittelee tavoitteet itsenäisesti, saadaan aikaan kustannusten säästöä. Toisaalta tällainen käytäntö tuo tullessaan ongelmia: Ensinnäkin useimmat asiakkaat tarvitsevat joka tapauksessa henkilökohtaista ohjausta (vaikka olisi laadittu hyvinkin tarkat ohjeet). Lisäksi osa asiakkaista ei missään tapauksessa kykene itsenäiseen tavoitteiden asetteluun. On myös mahdollista, että syntyy ristiriitaisuuksia asiakkaiden määrittelemien tavoitteiden ja hoidon tosiasiallisten tulosten välillä. Näistä ongelmista huolimatta on mahdollista, että asiakkaiden oma tavoitteiden määrittely toimii jo sinänsä terapeuttisena interventiona.

Yhteisesti neuvotellut tavoitteet ovat Cardillosta (Reno VA Medical Center) tehokkain tapa toimia sillä edellytyksellä, että neuvotteleminen on mahdollista, ts. asiakkaan kunto tai intervention luonne mahdollistavat sen. Interaktiivinen tavoitteiden asettelun prosessi lisäsi Renon kokemusten perusteella todennäköisyyttä siihen, että tavoitteet olivat yhteensopivia tarjolla olevan hoidon kanssa. Kustannukset olivat pienet, koska tavoitteidenasetteluprosessi oli integroitu hoidon sisälle ja tavoitteiden dokumentointi korvasi osittain hoito-ohjelman seurantaa.

GAS:ia käytettäessä tavoitetta voidaan Cardillon mukaan pitää yhdessä asetettuna, kun asiakas on aktiivisesti mukana tavoitteiden asettelussa ja ymmärtää ja hyväksyy kunkin tavoitteen toivotun tason. Eräitä tavoitteita ei niiden luonteesta johtuen voida asettaa yhdessä: esimerkiksi tavoite, jossa mielenterveyspotilaan alkoholinkäytön hallinta on tarpeen, voi olla mahdoton asettaa yhdessä neuvotellen, jos potilas kieltää hoidon alkuvaiheessa alkoholiongelman. Yleisesti ottaen Renon henkilökunta tuli siihen tulokseen, että on terapeutin tehtävä varmistaa, että kukin tavoite heijastelee hoidon tavoitteita. Carcillo huomauttaa myös, että neuvottelumenettely ei sulje pois muiden kuin terapeutin ja asiakkaan mukana oloa, joten mukana voi olla myös muuta verkostoa. Joissain tapauksissa hoidon keskeinen teema voi olla potilaan voimaantuminen, jolloin tavoitteiden asettelu muotoutuu hoidon osaksi. Tällöin potilaat saavat mahdollisuuden tehdä erehdyksiä ja oppia niistä ja tavoitteiden tarkkuus jää tavoitteiden asettelun varjoon.

3.2. Seuranta

Cardillo toteaa, että sekä GAS:n puolustajat että kriitikot suosittelevat lähes yksimielisesti skaalattujen tavoitteiden riippumatonta arviointia. Tämä on paras tae siitä, että pisteytys tai tavoitteiden asettelu (follow-up guide) eivät ole puolueellisia. Toisaalta se, että asiakkaat itse pisteyttävät tavoitteita, voi toimia

10

asiakastyytyväisyyden mittarina. Lisäksi tavoitteiden asettelijoiden itse tekemä arvio antaa tietoa heidän asettamiensa tavoitteiden merkityksellisyydestä ja realistisuudesta. Tämä taas auttaa tavoitteiden asettelijoita asettamaan entistä parempia tavoitteita uusille asiakkaille. GAS:n oleellisista piirteistä juuri vaatimus riippumattomasta tavoitteiden toteutumisen seurannasta tuottaa eniten kustannuksia. Kustannustehokkaimpana menetelmänä – sen sijaan, että käytettäisiin ulkopuolisia ammattiarvioijia – Cadrillo ehdottaa käytettäväksi sisäistä auditointia, joka riittää useimmissa tapauksissa pitämään yllä arvioinnin riippumattomuutta ja laatua. Tämä on mahdollista sillä edellytyksellä, että arvioijat eivät ole olleet suoranaisesti mukana arvioitavan asiakkaan prosessissa. Tutkimustarkoituksiin on tieteellisen tutkimuksen traditionkin perusteella käytettävä ulkopuolisia arvioijia.

Arviointimenettelyn toteuttamisessa täytyy ottaa myös huomioon arvioijien kouluttaminen, arvioinnin ajankohdan määrittely sekä arvioinnin konteksti ja menetelmät. Joissain tilanteissa tavoitteet voidaan määritellä niin tarkoin, että arviointi on mahdollista antaa toimistohenkilöstön (clerical staff) tehtäväksi. Tällaisia ovat esimerkiksi laboratoriotuloksin, kouluarvosanoin, standardoiduin testituloksin yms. arvioitavat tulokset. Toisaalta, kun arvioinnissa tarvitaan vaikkapa mielenterveyden tilan täydellinen arviointi, on välttämätöntä, että arvioijalla on tarvittava koulutus.

Seurannan toteuttamisen ajankohdan määrittelyssä on Cardillon mielestä yleensä kaksi päälinjaa: arviointi toteutetaan joko hoidon päättyessä tai tavoitteen asettajan ennalta määrittelemänä muuna ajankohtana. Seuranta-ajankohdan asettaminen on usein hoitokäytäntöön liittyvä asia. Päätös voi esimerkiksi määritellä ajan, jonka hoitotaho on vastuussa asiakkaasta. Cardillo tuo esille myös käytännön ongelmia, joita nousee esille vaikkapa silloin, kun suunniteltu hoito loppuukin ennakoitua aiemmin tai jatkuu ennakoitua kauemmin. Tällöin on ratkaistava mm. se arvioidaanko hoito-ohjelman tehoa kokonaisuudessaan vai ennalta määriteltynä ajankohtana hoidon kestosta riippumatta. Yksilöllisesti ennalta määriteltyjen seuranta-ajankohtien ongelmana voi pitää myös seurannan aikatauluttamista. Reno VA Medical Centerin käytännön kokemusten perusteella seuranta olisi järkevintä toteuttaa mieluummin hoidon loppuessa kuin tavoitteiden asettelijan ennalta määrittelemänä ajankohtana.

Arvioinnin huolellinen strukturointi on Cardillosta myös välttämätöntä, jotta vältetään mm. tilanteita, joissa arvioijan tieto asiakkaan rinnakkaisilla mittareilla arvioitavista tuloksista voisi vaikuttaa arviointiin. Yksityisyys ja luottamuksellisuus on myös turvattava arvioinnissa.

Joissain tapauksissa on havaittu myös arvioinnin aiheuttavan reaktiivisia vaikutuksia. Jotkut arviointitilanteet ovat muotoutuneet itsessään interventioiksi tai toisaalta aiheuttaneet ongelmien aktivoitumista. Nämä yllättävät arvioinnin vaikutukset on syytä ottaa huomioon arviointia suunniteltaessa.

Tavoitteiden pisteyttämiseen (Goal Attainement Scores) palataan kirjassa myöhemmin. Tässä yhteydessä todetaan, että tavoitteiden arvioinnin (Follow-Up Guidesta) jälkeen on tehokkainta, että arvioija itse laskee asiakkaiden saavuttamien tulosten arvot. Jos siis asiakas on saavuttanut tason -1 yhdellä, tason 0 toisella ja tason +2 toisella, lasketaan näiden arvojen summa, josta taas lasketaan esimerkiksi Kiresukin ja Shermanin T-arvoa käyttämällä yhteinen arvo.

3.3. Tavoitteidenasetteluprosessin laadun seuranta (monitoring)

Cardillo kiinnittää paljon huomiota tavoitteiden asettelun laadulliseen yhtenäisyyteen. Vaikka tavoitteet asetetaankin yksilöllisesti, niiden täytyy olla kuitenkin yhteneväisiä toiminnan kokonaisuuden kanssa (esim.

11

mielenterveys). Tavoitteiden tulee myös olla sellaisia, että kunkin asiakkaan on ne mahdollista kyseisessä toiminnassa saavuttaa. Tavoitteiden realistisuus ja relevanssi ovat ehdottoman tärkeitä ottaa huomioon kaikissa GAS:n sovelluksissa. Ainoa tapa varmistaa näiden ehtojen toteutuminen on Cardillon mielestä tehokas tavoitteidenasetteluprosessin arviointi. GAS on Cardillon mielestä oikein toteutettuna itsessään hyvä tae siitä, että tavoitteet ovat kunkin asiakkaan tilanteessa realistisia ja relevantteja.

Cadrilo toteaa, että tavoitteidenasetteluprosessi on GAS:n käytön ydin. Seuranta-ajankohtana kukin tavoite pisteytetään sen mukaan kuinka hyvin asiakas on saavuttanut kunkin tavoitteen odotetun tason (expected level of outcome). Pisteytys vääristyy, mikäli tavoitteet on asetettu liian alas tai liian korkealle, koska tällöin ne eivät kunnolla kuvaa intervention onnistumista. Riittävä laadun seuranta mahdollistaa myös tämän kaltaisten ongelmien vähenemisen. Toinen samankaltainen pulma on pisteiden arvioijan mahdollinen puolueellisuus (bias) tai epärealistiset ennakko-odotukset.

Tavoitteiden realistisuutta suurempana pulmana Cardillo pitää niiden relevanssin varmistamista. Ilman relevanssia GAS:ia ei voida pitää muita standardoituja arviointimenetelmiä parempana. On mahdollista vaikkapa asettaa tavoitteita, joilla on ”mielenterveyssisältö” mutta jotka eivät ole asiakkaan tilanteessa tarkoituksenmukaisia. Toisaalta voidaan asettaa mielenterveystyössä tavoitteita, jotka liittyvät somaattisiin sairauksiin, jolloin niiden vieminen eteenpäin tapahtuu toisessa hoitoyksikössä. Tällöin tavoitteen toteutuminen tai toteutumatta jääminen ei kuvasta mielenterveystyön tuloksia. Tällaisissa tilanteissa Cardillo opastaa laatimaan erilliset tavoitteet kummallekin hoitolinjalle, jolloin tulokset voidaan pisteyttää ja arvioida erikseen.

Sivuilla 51 – 59 Cardillo kuvaa Reno VA Medical Centerin, joka on vuodesta 1976 alkaen tutkinut ja soveltanut GAS:ia, tapaa varmistaa sen käytön laatua. Tämän toiminnan ytimenä on ”laadunseurantakomitea” (Goal Monitoring Committee), jossa Renon tapauksessa oli aluksi kolme jäsentä: mielenterveyspalveluiden päällikkö (psykiatri), ylihoitaja (psykiatrian erikoissairaanhoitaja ja konsultoiva psykiatri (psykiatrian professori Renon opetussairaalassa). Myöhemmin mukaan otettiin neljäs jäsen paikkaamaan muiden jäsenten poissaoloja. Kukaan komitean jäsenistä ei ollut mukana tutkimuksissa tai GAS:n kliinisessä käytössä ja lisäksi kaikki olivat kokeneita psykiatrian ammattilaisia. Näin varmistettiin se, että komitean oli mahdollista arvioida GAS:n käytön kliinistä relevanssia, resurssien riittävyyttä ja yksilöllisten tavoitteiden saavuttamisen realistisuutta. Auditoinnissa arvioitiin asteikolla 1 – 5 potilaskohtaisesti tavoitteiden relevanssia suhteessa mielenterveysongelmiin, tarvittavien resurssien saatavuutta kunkin tavoitteen toteutumisen mahdollistamiseksi ja kolmantena odotettujen tulosten realistisuutta. Auditoinnin tuloksena havaittiin, että tavoitteiden dokumentointi potilasasiakirjoihin parani, ennestäänkin korkealla ollut tavoitteiden relevanssi suhteessa mielenterveystyöhön koheni ja tavoitteiden huomattiin olevan huomattavan realistisia. Cardillo toteaa, että Renon kokemusten perusteella kaikissa GAS:n sovelluksissa tällainen auditointi olisi hyödyllistä. Renon havaintojen ja kokeilujen perusteella auditointia varten ei tarvitse välttämättä käyttää johtavien työntekijöiden resursseja, koska tämä lisää auditoinnin kustannuksia. Terapiatyötä tekevien ottaminen mukaan auditointiin tuotti yhä lisääntyvää tavoitteiden realismia, jonka lisäksi auditoinnin kustannukset alenivat. Tällaisen vertaisarvioinnin hyötynä havaittiin myös se, että arvioijat samalla oppivat itsekin asettamaan entistä realistisempia ja relevantimpia tavoitteita. Samalla myös ymmärrys dokumentoinnin merkityksestä lisääntyi.

Cardillo pitää skaalojen realistisuuden varmistamista GAS:n käytön kannalta välttämättömänä. Sen takaamiseksi on oltava käytössä seuranta, jonka perusteella realistisuutta arvioidaan jatkuvasti. Jos tavoitteiden asettelijat ovat liian optimistisia ja asettavat jatkuvasti tavoitteita, joita on vaikea saavuttaa,

12

GAS:in T-arvot jäävät jatkuvasti alle keskiarvon 50 (tällöin skaalojen pisteiden keskiarvo on siis alle nollan). Mikäli tavoitteiden realistisuutta ei seurata riittävästi, vaikeutuu kunkin hoitoyksikön tai -ohjelman sisäisten tavoitteiden toteutumisen arvioinnin ohella myös eri yksiköiden ja ohjelmien keskinäinen vertailu. Tavoitteena ei ole päästä tilanteeseen, jossa T-arvojen keskiarvo olisi jatkuvasti 50, koska GAS:n käytössä ei tällöin olisi järkeä. Seurannan myötä kuitenkin on mahdollista kehittää GAS:n käyttöä ja tavoitteiden asettajien oppia yhä paremmiksi tässä työssä. Seuranta siis edellyttää myös riittävää palautetta tuloksista GAS:n käyttäjille.

4. GAS:n sovelluksia (ss. 61 – 104)

Thomas J. Kiresuk ja Robert O. Choate

Kiresukin ja Choaten mielestä GAS on väline, joka taipuu monenlaisiin yhteyksiin ja sovelluksiin. Sitä on käytetty kasvatuksessa, lääketieteessä, ammatillisessa kuntoutuksessa, mielenterveystyössä, sosiaalityössä ja monenlaisissa neuvonta- ja ohjauspalveluissa. Kiresuk ja Choate esittelevät luvussa laajan kirjon eri sovelluksia, joita he ovat jonkin verran editoineet selkeyden ja pisteytettävyyden parantamiseksi. Tässä työssä tuli esille dilemma, joka luultavasti on myös tavoitteiden asettelijoiden ratkaistavana: tavoitteena oli laatia teknisesti informatiivisia asteikkoja ja samalla säilyttää alkuperäisten sovellusten ydin. Esimerkiksi lääketieteellisissä sovelluksissa asteikot näyttivät kuvastavan syndroomia tai oireiden kokonaisuuksia. Vaikka teknisesti olisikin oikein laatia erilliset skaalat kullekin flunssan oireelle, ainoastaan lääketieteen tutkijat luultavasi pitäisivät hyödyllisenä näin tarkkaa asteikkojen rakentelua (… follow-up guide). Tässä yhteydessä siis liiallinen tarkkuus voi muodostua ongelmaksi, ja kirjoittajat siteeraavat Aristotelesta (Meehl 1970): ”Sivistynyt (educated) henkilö pyrkii kussakin asioiden luokassa vain sellaiseen tarkkuuteen, johon aihepiiri antaa mahdollisuudet.” Mehl täydentää ajatusta toteamalla, että ei myöskään vähempään. Poimin tähän tiivistelmään muutamia Kiresukin ja Choatesin esimerkkejä taulukoina (follow-up guide) ja täydennän niitä tarvittaessa kirjoittajien kommenteilla.

13

4.1. Sovellukset kasvatuksessa ja koulutuksessa

GAS siis kehitettiin alun perin mielenterveystyön tulosten arviointiin. Kiresuk ja Choate toteavat, että suhteellisen pian havaittiin sen sovellettavuus koulutuksessa ja kasvatuksessa (education).

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Tappeleminen

Skaala 2 Koulutyöskentely

Paljon vähemmän -2 kuin odotettiin

Fyysistä ja verbaalista aggressiota tarkankin seurannan alaisena.

Opettaja suosittelee eristämistä (retention) jatkuvan työskentelystä kieltäytymisen seurauksena.

Hieman vähemmän -1 kuin odotettiin

Fyysistä aggressiota, kun ei ole tarkan seurannan alaisena.

Kieltäytyy suorittamasta päivittäisiä vähimmäistehtäviä.

Tavoite on toteutunut 0odotetulla tavalla

Välitunnit ja lounastauot sujuvat niin, että on ainoastaan sanallista aggressiota.

Päivittäiset vähimmäistehtävät sujuvat avustettuina.

Hieman enemmän +1 kuin odotettiin

Tavanomaiset koulurutiinit sujuvat niin, että on ainoastaan sanallista aggressiota.

Päivittäiset vähimmäistehtävät sujuvat ilman avustamista.

Paljon enemmän +2 kuin odotettiin

Aggressiivinen käyttäytyminen ei ole ongelma opettajan arvioimana.

Ottaa itsenäistä vastuuta tehtävien suorittamisesta (arvosanat korkeampia kuin C)

HuomautuksetEsimerkki 4.3. Erityiskasvatuksen oppilaan käyttäytyminen (s. 66)

14

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Ruokailukäyttäytyminen

Skaala 2 Raivokohtaukset

Skaala 3Pukeutumistaidot

Paljon vähemmän -2 kuin odotettiin

Syö yksin tarkasti valvottuna.

5 tai enemmän raivokohtauksia viimeisten 3 päivän aikana.

Vanhemmat pukevat lapsen kokonaan.

Hieman vähemmän -1 kuin odotettiin

Syö yksin ilman valvontaa.

3 tai 4 raivokohtausta päivässä viimeisten 3 päivän aikana.

Vanhemmat pääasiassa pukevat lapsen (vetävät housut ylös, paidan alas jne.)

Tavoite on toteutunut 0odotetulla tavalla

Syö ruokapöydässä muiden lasten kanssa valvottuna.

1 tai 2 raivokohtausta päivässä viimeisten 3 päivän aikana.

Lapsi pukeutuu itse lukuun ottamatta kenkiä ja sukkia; ei napita, sido kengännauhoja tai sulje vetoketjua.

Hieman enemmän +1 kuin odotettiin

Syö ruokapöydässä muiden lasten kanssa ilman valvontaa tai vähän valvottuna.

Ei enempää kuin 2 raivokohtausta koko yhteensä viimeisten 3 päivän aikana.

Laittaa myös kengät ja sukat, mutta ei solmi nauhoja, sulje vetoketjua tai napita.

Paljon enemmän +2 kuin odotettiin

Syö perheen kanssa ilman valvontaa.

Ei raivokohtauksia viimeisten 3 päivän aikana.

Lapsi solmii kengännauhat, napittaa, sulkee vetoketjun.

HuomautuksetEsimerkki 4.4. Erityiskasvatus: ryhmätyöskentelytaidot (s. 66)

Tässä tapauksessa sosiaalityöntekijät, erityisopettajat ja opiskelijat laativat yhdessä yksilöllisiä tavoitteita, joista vähintään yksi liittyi käyttäytymiseen ja yksi opintosaavutuksiin. Lisäksi laadittiin tavoitteita käyttäytymisestä ryhmässä, päihteiden käytöstä, rästitöiden tekemisestä, painonhallinnasta, aamuheräämisestä, tulevaisuuden suunnittelusta jne. Oppilaat ja henkilökunta arvioivat tavoitteita viikoittain. Kunkin kahdeksan viikon opetusjakson jälkeen viikoittaisista pisteistä laskettiin keskiarvo, josta kunkin oppilaan lopullinen pistemäärä laskettiin.

GAS:ia on käytetty myös aikuiskasvatuksessa ja ammatillisessa jatkokoulutuksessa, josta seuraava esimerkki sairaalapappien koulutuksesta. Kyseisessä sovelluksessa opiskelijat esittivät kouluttajalle ensin 5 – 10 tavoitetta, jotka esitettiin myös muille opiskelijoille. Nämä muovattiin kouluttajan johdolla GAS-muotoon ja koulutuksen edetessä niitä seurattiin ja muutoksista keskusteltiin. Jakson lopuksi opiskelija ja kouluttaja ensin pisteyttivät taulukon omalla tahollaan, jonka jälkeen lopulliset pisteet määriteltiin yhteisessä keskustelussa. Kiresukin ja Choaten mielestä tämä sovellus oli kiinnostava siksi, että siinä GAS:ia käytettiin koulutuksessa, jossa itseohjautuvuus ja opiskelijoiden oma motivaatio on tärkeää ja lisäksi se toimi myös oppimisen ohjausvälineenä.

15

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Itsesyytösprosessin ymmärtäminen

Skaala 2 Kuolemansairaiden neuvonta (counseling)

Skaala 3Tieto keskenmenosta

Paljon vähemmän -2 kuin odotettiin

Vähemmän kuin 10 %. Tuntee olonsa erittäin epämukavaksi neuvoessaan kuolemansairaita.

Ei jaa tietoa.

Hieman vähemmän -1 kuin odotettiin

10-24 %. Tuntee olonsa epämukavaksi suurimman osan ajasta neuvoessaan kuolemansairaita.

Jakaa tietoa, joka perustuu lehtiartikkeleihin.

Tavoite on toteutunut 0odotetulla tavalla

Opiskelija tunnistaa 25-40% tilanteista, jotka aiheuttavat itsesyytöksiä.

Tuntee olonsa mukavaksi noin puolet ajasta neuvoessaan kuolemansairaita.

Jakaa tietoa hengellisestä näkökulmasta SA-neuvontaohjeita hyödyntämällä.

Hieman enemmän +1 kuin odotettiin

Tunnistaa enemmän kuin 40 %.

Tuntee olonsa mukavaksi vähintään 75 % ajasta neuvoessaan kuolemansairaita.

Yllä olevan lisäksi hyödyntää vähintään yhdeltä synnytyslääkäriltä saamaansa tietoa.

Paljon enemmän +2 kuin odotettiin

Pystyy myös ehkäisemään vähintään 40 % tilanteista.

Tuntee olonsa mukavaksi koko ajan neuvoessaan kuolemansairaita.

Yllä olevan lisäksi ottaa mukaan vähintään yhden synnytyslääkärin tietoa jakamaan.

HuomautuksetEsimerkki 4.6. Sairaalapappien koulutus (s. 69).

Kasvatuksen ja koulutuksen alalta löytyy lukuisia muita sovelluksia. Kiresukin ja Choaten havaintojen mukaan niiden ohjelmat ovat laaja-alaisia, joten tavoitteet vaihtelevat helposti määriteltävissä olevista hyvinkin vaikeasti määriteltävissä oleviin. Erityisen hyödyllisenä GAS:ia voi heidän mielestään pitää ohjelmissa, joissa kasvatukseen, emootioihin, sosiaalisten taitojen puutteeseen ja vaikeisiin sosiaalisiin ongelmiin pyritään vaikuttamaan.

4.2. Sovellukset lääketieteen alalla

Lääketieteen alalta sisällytän referaattiin esimerkin, jossa GAS:ia käytettiin sekä projektin että osallistujakohtaisten tavoitteiden määrittelyssä. Esimerkissä 4.8. esitellään henkilökunnan tehtävät ja

16

päämäärät, joista tulevat esille sekä koko projektin tavoitteet että kohderyhmää varten laaditun ohjelman erityispiirteet.

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Intiaanien ruokavaliokysely

Skaala 2 Intiaanien ruokavalion suunnittelu

Skaala 3Ryhmäopetuksen seuranta

Paljon vähemmän -2 kuin odotettiin

Yhdyskuntatyöntekijöiden kouluttaminen tiedonkeruuseen.

Suunnitelmaa muuttujien selvittämiseksi ei ole laadittu.

Ei osallistujia seurantaryhmissä.

Hieman vähemmän -1 kuin odotettiin

Kysely annettu vähintään 100 perheelle.

Muuttujien tutkimusta varten on laadittu suunnitelma.

Viikoittainen kontakti ryhmä n 1 jäseniin 3 tai alle 3 viikon ajan.

Tavoite on toteutunut 0odotetulla tavalla

Tiedon kerääminen intiaanien ravintotottumuksista.

Intiaanien ruokavalioon liittyvät muuttujat on selvitetty tutkimuksella.

Viikoittainen kontakti ryhmän 1 jäseniin vähintään 4 viikon ajan, jotta opitun käyttäytymisen arvioiminen on mahdollista.

Hieman enemmän +1 kuin odotettiin

Yllämainittu on toteutunut alle 3 kuukaudessa.

Suunnitelma suositeltavasta ruokavaliosta on laadittu tutkimustietojen pohjalta.

Viikoittainen kontakti 5 tai useamman viikon ajan.

Paljon enemmän +2 kuin odotettiin

Toteutunut alle 2 kuukaudessa.

Ravintosuositusten arviointi vähintään yksi kuukausi aikataulusta edellä.

Kontakti 5 tai useamman viikon ajan 2 tai useamman ryhmän kanssa.

HuomautuksetEsimerkki 4.8. Syntyperäisten amerikkalaisten diabetesneuvonta: ohjelman tavoitteet (s. 70).

Ohjelman tavoitteena oli diabetesneuvonta mutta yksilölliset tavoitteet sisälsivät perheeseen, sosiaalisiin asioihin ja omaan selviytymiseen liittyviä asioita.

17

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Rintojen hoitaminen ja rintaruokinta

Skaala 2 Perhesuunnittelu

Skaala 3Terveystieto

Paljon vähemmän -2 kuin odotettiin

Ei pysty rintaruokintaan, rinnat turvonneet ja nännit rohtuneet.

Ei ajattele tai harkitse ehkäisyä.

Ei ymmärrä yksinkertaisia terveydenhoitoon liittyviä ohjeita.

Hieman vähemmän -1 kuin odotettiin

Tuo esille epämukavuutta rinnoissa, ei pysty rintaruokintaan.

On valinnut ehkäisymenetelmän mutta ei ole siihen tyytyväinen.

Kuuntelee ja toistaa ohjeet mutta ei osaa hyödyntää niitä.

Tavoite on toteutunut 0odotetulla tavalla

Ei epämukavuudentunnetta rinnoissa, mutta ei rintaruokintaa.

On valinnut sopivan ehkäisymenetelmän.

Osaa puhelimitse ohjattuna hyödyntää vauvanhoito-ohjeita.

Hieman enemmän +1 kuin odotettiin

Ei epämukavuudentunnetta rinnoissa, rintaruokinta onnistuu vaikeuksitta.

Käyttää ehkäisyä 50 % ajasta.

Hyödyntää hoito-ohjeita itsenäisesti.

Paljon enemmän +2 kuin odotettiin

Ei epämukavuudentunnetta rinnoissa, nauttii rintaruokinnasta.

Käyttää ehkäisyä enemmän kuin 50 % ajasta.

Hyödyntää ohjeita oman vauvan hoidossa ja esittää sopivia ohjeita vauvanhoitoa koskevissa. ryhmäkeskusteluissa.

HuomautuksetEsimerkki 4.9. Syntyperäisten amerikkalaisten diabetesneuvonta: potilaan tavoitteet (s. 71).

Muita lääketieteen sovelluksia löytyy mm. geriatriasta, lasten neurologisista ongelmista, vankilalääketieteestä ja lääketieteen koulutuksesta.

4.3. GAS:n soveltaminen kuntoutukseen

18

Sisällytän referaattiin esimerkin GAS:n soveltamisesta ammatilliseen kuntoutukseen, josta Kiresukin ja Choaten mukaan tuli yksi ensimmäisistä menetelmää kuvaavista väitöskirjoista. Alla on tyypillinen esimerkki Chigagon juutalaisen ammattioppilaitoksen (Jewish Vocatonal Service of Chigago) asiakkaasta.

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Riippuvuus äidistä

Skaala 2 Työmotivaatio

Skaala 3Hyväksynnän hakeminen

Paljon vähemmän -2 kuin odotettiin

Äiti valitsee Isabelin vaatteet.

Ei ilmoittaudu työhön. Etsii jatkuvasti hyväksyntää päätöksilleen.

Hieman vähemmän -1 kuin odotettiin

Kysyy neuvoa äidiltä vaatteiden valinnassa.

Ilmoittautuu työhön myöhemmin ensimmäisen päivän jälkeen.

Hakee hyväksyntää päätöksilleen mutta pyytää anteeksi, että on kysynyt varmistusta.

Tavoite on toteutunut 0odotetulla tavalla

Keskustelee yleensä vaatteiden valinnasta äidin kanssa mutta tekee valinnan itse.

Ilmoittautuu työhön ensimmäisenä aikatauluun sovittuna työpäivänä.

Hakee varmistusta päätöksilleen mutta huomaa sen ja lopettaa tämän jälkeen.

Hieman enemmän +1 kuin odotettiin

Tekee valinnan yleensä keskustelematta äidin kanssa.

Ilmoittautuu työhön viitenä ensimmäisenä työpäivänä.

Ei hae hyväksyntää päätösten tekemisen yhteydessä mutta kysyy joskus vahvistusta, kun päätös on tehty: ”Luuletko, että tein oikean päätöksen?”

Paljon enemmän +2 kuin odotettiin

Valitsee vaatteet täysin itsenäisesti.

Ilmoittautuu työhön 20 ensimmäisenä työpäivänä.

Ei hae päätöksilleen hyväksyntää.

HuomautuksetEsimerkki 4.17. Kuntoutusneuvonta: asiakkaan tavoitteet (s. 79).

Kirjoittajat huomauttavat, että GAS:n havaittiin sopivan työelämään valmistavien ammatillisten ja ei-ammatillisten tavoitteiden asettamiseen ilman, että kuntoutussuunnitelmien vaatimukset vaarantuivat. Myös ohjelman tavoitteita arvioitiin GAS:n avulla, ja alla on niitä kuvaava asteikko.

19

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement Skaala 1Asiakkaat, jotka saavat suojatyöpaikan

Skaala 2 Competitive Wage Earners

Paljon vähemmän -2 kuin odotettiin

6 % tai vähemmän. $ 89 tai vähemmän

Hieman vähemmän -1 kuin odotettiin

7 – 9 %. $ 90 - $99

Tavoite on toteutunut 0odotetulla tavalla

10 – 12 % kaikista asiakkaista on pysyvästi suojatyössä 90 päivän kuluessa.

Kaikkien ohjelman päättäneiden, työllistyneiden asiakkaiden keskimääräinen ansio on 100 – 110 $ viikossa.

Hieman enemmän +1 kuin odotettiin

13 – 15 %. $ 111 - $120

Paljon enemmän +2 kuin odotettiin

16 % tai enemmän. $ 121 tai enemmän

HuomautuksetEsimerkki 4.18. Kuntoutusneuvonta: ohjelman tavoitteet (s. 80).

Kirjan toinen, kuntoutusta koskeva esimerkki, löytyy sokeiden ja näkövammaisten kuntoutuksesta. Tässä yhteydessä skaaloja laadittiin mm. matkustustaidoista, ruuanvalmistuksesta ja sokeutumiseen sopeutumisesta. Lisäksi sovelluksia löytyy mielenterveyspalveluista, sosiaalipalveluista (esim. avioliittoneuvonta, lasten hyväksikäyttötapaukset), kriisiterapiasta, vankeinhoidosta ja päihderiippuvuuden hoidosta.

20

5. GAS:n käytön koulutus (ss. 105 – 117)

Thomas J. Kiresuk, Robert O. Choate, Joseph E. Cardillo and Nancy Larsen

Kirjoittajien mielestä GAS:n käyttöön liittyvästä koulutuksesta on julkaistu niukasti materiaalia. Luvussa esitetyt periaatteet ja tekniikat perustuvat useiden menetelmää käyttäneiden kokemuksiin. Seuraavia periaatteita ei täydy pitää muuttamattomina sääntöinä vaan pikemminkin perusperiaatteina, joiden pohjalle kussakin tilanteessa sovellettava koulutus voidaan pohjata.

Ensimmäisenä on kirjoittajien mielestä syytä ottaa huomioon GAS:n käytön asetelma siitä syystä, että menetelmää sovelletaan laajassa kirjossa erilaisia toimintoja. Esimerkiksi koulutusfilosofia on hyvin erilainen hoitoalan oppilaitoksessa verrattuna pieneen maaseudulla mielenterveyspalveluita tarjoavaan yksikköön tai kaupungin keskustassa toimivaan yksikköön. Lisäksi organisaation tehtävällä on vaikutusta koulutukseen, ja erimerkiksi sotilaallisessa organisaatiossa, yksityisessä yrityksessä ja julkisen palvelun organisaatiossa on todennäköisesti omat koulutuksen toteuttamiseen vaikuttavat toimintatapansa. Nämä erot on syytä koulutuksen lisäksi ottaa huomioon myös laadunvarmistuksessa ja seurannassa. Esitettävät perusperiaatteet ovat silti kirjoittajien mielestä suurimmaksi osaksi sovellettavissa luonteeltaan erilaisissa organisaatioissa.

Koulutuksen toteuttamiseen ei välttämättä tarvita mittavia resursseja – kirjassa esitellyssä ohjelmissa on ollut se etu, että ne ovat saaneet tutkimusrahoitusta. GAS:n myöhemmissä sovelluksissa ei tarvitse ottaa huomioon kehittelyn ja keksimisen aiheuttamia kustannuksia. Näin ollen koulutus on tarvittaessa mahdollista järjestää jo olemassa olevilla resursseilla, ja luvussa jäljempänä kouluttajalla tarkoitetaan ketä tahansa henkilöä, joka toteuttaa GAS-koulutusta. Koulutuksessa aiheuttaa merkittäviä kustannuksia osaamisen ylläpito ja laadunvarmistus. Kirjoittajat pitävät erityisen merkittävänä GAS:n laadukkaan käytön kannalta sitä, että käytössä on jatkuva laadunvarmistus ja käytön ohjaus. Psykometrisissä mittareissa oletetaan yleensä, että ohjeistus ja koulutus alussa riittävät takaamaan mittarin ammattitaitoisen käytön mutta GAS:n kohdalla suositellaan jatkuvaa seurantaa.

Koulutusta suunniteltaessa on myös tärkeää ottaa huomioon koulutettavien yksilölliset erot. Kirjoittajien mielestä on aivan toista kouluttaa GAS:n käyttöön kokeneita kliinikoita verrattuna vaikkapa opiskelijoihin. Lisäksi, vaikka GAS on sinänsä yksinkertainen menetelmä, on kirjoittajien kokemusten mukaan joskus myös kokeneiden työntekijöiden vaikea syystä tai toisesta oppia laatimaan selkeitä, pisteytettäviä skaaloja. Myös tuleva käyttötarkoitus täytyy ottaa huomioon koulutusta suunniteltaessa. Kirjoittajien mielestä esimerkiksi tutkimuskäyttöön tai hoito-ohjelman vaikuttavuuden arviointiin käytettäessä GAS:n koulutuksen vaatimukset ovat suuremmat kuin kliinisessä käytössä, jossa esimerkiksi laadullisten ja määrällisten käsitteiden esittely ei ole kovin tärkeää.

Ennen varsinaisen koulutuksen aloittamista on kirjoittajien mielestä yleensä hyödyksi arvioida organisaation ja henkilökunnan tarpeet ja luonne. Näin pystytään suuntaamaan koulutus merkityksellisiin asioihin sen sijaan että toteutettaisiin kaavamaisesti valmista opetussuunnitelmaa. Esimerkiksi rekrytoimalla jo suunnitteluvaiheessa organisaation avainhenkilöt mukaan käyttämällä avuksi haastatteluita tai tapaamisia pienissä ryhmissä on osoittautunut hyödylliseksi. Ennakkoarviointi on antanut mahdollisuuden selvittää suunnitellun koulutuksen vahvat ja heikot puolet. Lisäksi ennakkoarvioinnissa aikaansaatu avainhenkilöiden – mm. mielipidejohtajien, ohjelmajohtajien, johtokunnan jäsenten ─ tuki on kokemusten

21

mukaan parantanut koulutusohjelmien tuloksia, varsinkin jos em. henkilöt ovat olleet esittelemässä koulutusohjelman tavoitteita ja GAS:n merkitystä organisaation toiminalle.

Koulutusohjelman suunnittelussa on myös syytä ottaa huomioon se, että määrätyt akateemisessa toimintaympäristössä käyttökelpoiset menetelmät eivät lähestulkoon varmasti toimi työpaikkaympäristössä. Kirjoittajat toteavat, että esimerkiksi kotitehtävät tai kirjallisuuden lukeminen jäävät useimmiten tekemättä ennen koulutustapahtumia. Menetelmien täytyy olla sellaisia, että ne kunnioittavat ammattilaisten asemaa ja osaamista. Lisäksi kouluttajien on vältettävä ammattilaisten alueelle tunkeutumista (territorial transgression) ja toimittava niin, että nämä eivät joudu tilanteisiin, joissa on huolena kasvojen menetys kollegoiden silmissä. Palautteen tulee olla hienovaraista ja se on syytä antaa yksilöllisesti. Yksilöllistä ohjausta tarvitaan myös tavoitteiden asetteluprosessin opiskelussa, vaikka yleinen informaatio ja orientaatio voidaankin antaa koulutusryhmissä. Ohjauksessa on kirjoittajien mielestä tärkeää tuoda esille GAS: n merkityksellisyyttä koulutettavien työssä. Varsinkin hyvin heterogeenisissä toimintaympäristöissä yksilöllinen ohjaus saattaa olla ainoa keino yhdistää GAS määrättyyn kliiniseen käytäntöön.

Perustietous GAS:ista on kirjoittajien mielestä mahdollista jakaa useammalla tavalla. Yleisin tapa on jakaa yhteenvetoja luentomonisteina koulutustapahtumien aikana ja täydentää niitä käsikirjoilla ja muilla julkaisuilla, joita voidaan tutkia koulutuksen aikana tai myöhemmin. Referoitavan kirjan alkuluvut voivat esimerkiksi toimia tällaisina tiivistelminä. Koulutusten tulosten arviointiin ei ole olemassa sertifioituja menetelmiä, joten yleinen tapa arvioinnissa on tutkia tiedon tasoa koulutuksen yhteydessä kysymys ja vastaus –osioissa.

Kirjoittajat toteavat, että hyvin yleinen havainto GAS:n käyttöönoton yhteydessä on ollut se, että pelkkä tieto menetelmästä ei vielä riitä tuottamaan pätevyyttä tavoitteiden (follow-up guide) laatimiseen. Joskus eniten tietävillä on ollut huomattavia vaikeuksia tuottaa pisteytettäviä skaaloja. Edelläkin jo mainitussa Renon ohjelmassa kokeiltiin useita tapoja opitun tiedon siirtämisessä käytännön tasolle. Ryhmäopetusta järjestettiin 2 – 25 hengen ryhmissä – yhden tai useamman kouluttajan vetäminä ja video-opetusta käyttäen. Johtopäätöksenä oli se, että tehokkain tapa toimia oli kouluttajan antama yksilöllinen ohjaus. Tässä yhteydessä kirjoittajat toteavat vielä, että kouluttaja oli pikemminkin oppimisprosessin helpottaja (facilitator), jonka tehtävänä oli kiinnittää huomiota tavoitteiden pisteyttävyyteen ja suunnitella menetelmiä niiden laadun varmistamiseen.

Kirjoittajat toteavat, että GAS-kouluttajien kesken vallitsee vahva yksimielisyys siitä, että parhaat tulokset saavutetaan, kun koulutuksessa käytetään hyväksi todellista asiakasaineistoa. Esimerkiksi Renon tapauksessa heti orientaatiovaiheen jälkeen kliinikot ryhtyivät yhdessä kouluttajien kanssa soveltamaan menetelmää potilastyössä. Tähän tarvittava aika vaihteli yksilöllisesti kahdesta tai kolmesta kokeilusta muutaman päivän aikana lukuisiin kokeisiin usean viikon jaksolla. Tavoitteiden asettelijan ammatillisella kokemuksella näytti olevan yhteys siihen kuinka paljon opastusta käyttöönotossa tarvittiin. Merkittävä havainto oli se, että kun tavoitteiden asettelija oppi etsimään kullekin tavoitteelle odotetun tuloksen tason, ei ollut enää vaikeaa löytää vähän enemmän ja vähän vähemmän –tasoja.

Useissa yhteyksissä koulutettavat ovat olleet epävarmoja tavoitteiden asettamisen rajoituksista. Kirjoittajien mielestä tällainen huoli liittyy useimmiten behaviorismin valta-asemaan. Vaikka useimmiten pyrittäisiinkin siihen, että arvioidaan havaittavia muutoksia, voi GAS:ssa mikä tahansa muukin todiste muutoksesta riittää mittariksi. Edellisessä luvussa on esitelty useita esimerkkejä siitä, että mittarit ovat

22

sisältäneet laboratorioarvoja, omaisten tai ammattilaisten näkemyksiä muutoksesta, erilaisia dokumentteja tai havainnoitsijoiden arvioita jne.

Lisäksi kysymyksiä on herättänyt se, että missä määrin tavoitteiden toteutumisen täytyy olla yhteydessä hoitoon. Kirjallisuudessa on laajalti luvun kirjoittajien mukaan oltu sitä mieltä, että tavoitteissa olisi vältettävä toimintaa kuvaavia verbejä ja pikemminkin kuvattava ko. toiminnan tuloksia. Kirjoittajien mielestä käytäntö riippuu GAS:n käyttöyhteydestä: yhden henkilön prosessi voi olla toisen henkilön tulos. Esimerkiksi ”osallistuminen painonhallintaryhmään” voi olla ylipainoiselle potilaalle terapeuttinen tavoite, vaikka siihen ei liittyisikään painonpudotusta. Jos keskiössä on se mitä hoidon on tarkoitus saada aikaan, voidaan tavoitteita asettaa yhtä hyvin prosessina kuin niiden tuloksina. Kuntoutuksessa olevalle asiakkaalle se, että pelaa kerran kuussa golfia, on merkityksellinen tavoite – pelin pistemäärällä ei niinkään ole merkitystä. Keskustelua on herättänyt myös abstraktien käsitteiden, esimerkiksi riippuvuuden tai huonon itsetunnon, mittaaminen. Koulutusten yhteydessä näihin kysymyksiin on parhaiten löytynyt ratkaisuja keskustelemalla asiakastapauksista, joissa tällaisiin muutoksiin on päästy. Näin on saatu esille kuvauksia ja tapahtumia, joiden pohjalle tavoitetaulukoita (follow-up guide) on voitu rakentaa.

Koulutusten yhteydessä kirjoittajat pitävät erittäin tärkeänä myös sitä, että suunnitelmissa otetaan huomioon tarve taitojen ylläpitämiseen ja jatkuvaan laadunvalvontaan, joka on GAS:n sovelluksissa ollut tarpeellista. Tavanomainen koulutusstrategia, jossa opetetaan taidot ja annetaan valmiudet menetelmän käyttöön, ei kirjoittajien mielestä GAS:n kohdalla riitä. Näin on esimerkiksi siksi, että taidot kehittyvät epätasaisesti ja GAS:ia sovellettaessa nousee esille monimutkaisiakin skaalojen rakentamiseen liittyviä pulmia, joita varten kouluttajien tukea tarvitaan myöhemminkin.

Luvun loppukappaleessa kirjoittajat arvioivat koulutuksen kustannuksia. Heidän mielestään on mahdotonta GAS:n joustavuuden ja monissa eri asetelmissa tapahtuvan käytön takia antaa yleispätevää arviota kustannuksista. Esimerkiksi Renon tapauksessa montaa eri viitekehystä käyttävien terapeuttien koulutustarve vaihteli huomattavan paljon. Keskimääräinen tavoitteiden asettelijan käyttämä työmäärä oli 14 tuntia, joka sisälsi puolentoista tunnin yksilöllisen orientaation ja kahdentoista ja puolen tunnin ohjatun käyttöönoton. Kouluttajalta tarvittiin keskimäärin kuuden tunnin työpanos, johon sisältyi puolentoista tunnin orientaatio ja neljän ja puolen tunnin verran ohjausta. Toisessa yhteydessä suurehkossa mielenterveyskeskuksessa tarvittiin käyttäjien koulutukseen 8 – 12 tuntia, jonka lisäksi arvioijien koulutukseen käytettiin 2 – 3 tuntia. Kirjoittajien mielestä koulutusten kustannukset eivät juuri poikkea muiden mittareiden käyttöönoton kustannuksista. Kuitenkin GAS:n yhteydessä tarve jatkuvaan laaduntarkkailuun aiheuttaa välillisiä kustannuksia. Tätä pidetään kuitenkin välttämättömänä, koska ennen pitkää kokeneetkin käyttäjät kehittävät omia maneereita, jotka voivat johtaa skaalojen puolueellisuuteen.

6. GAS:n käyttöönotto (ss. 119 – 134)

Thomas J. Kiresuk ja Sander H. Lund

Kiresuk ja Lund toteavat, että seuraavat periaatteet soveltuvat minkä tahansa tekniikan käyttöönottoon. Luku perustuu muutamiin GAS:n käyttöönottoa koskeviin tutkimuksiin, Minneapolisin Program Evaluation Resource Centerissä saatuihin kokemuksiin ja eri käyttäjien kokemuksiin.

23

KÄYTTÖÖNOTON VAIHEET

Vaihe 1: Arvionnin tarpeen analyysi

Alkuun on Kiresukin ja Sanderin mukaan välttämätöntä tehdä perusteellinen analyysi siitä, minkälaiseen organisaation arvioinnin tarpeeseen GAS:ia on tarkoitus soveltaa. Tässä yhteydessä on tarpeen tehdä perusteellinen selvitys organisaation luonteesta ja perustehtävästä, joka käsittää sen rahoituksen, toiminnan kohteen ja tuloksen, asiakkaiden ja kumppaneiden odotukset organisaatiolta ja toimintaa ohjaavat standardit. Lisäksi on selvitettävä raportoinnin vaatimukset: keille ja missä muodossa niitä on tarpeen lähettää. Näistä lähtökohdista muodostuu 90 prosenttia arviointimenetelmistä, ja loppu koostuu lähinnä yksilölisistä tarpeista ja parhaana pidetystä tyylistä. GAS:n käyttöä voi Kiresukin ja Lundin mielestä harkita, jos analyysin perusteella tulee esille tarve ohjelman hallinnointiin, johon pitäisi sisältyä ennalta määritelty tavoite, yksilöllinen hoidon suunnittelu ja tiedon arkistointi tai tulosten arviointi/tutkimus.

Vaihe 2: Menetelmän valinta

Seuraava askel on edellä määriteltyjen tarpeiden pohjalta olemassa olevien mittareiden selvittäminen. Kirjassa on kauttaaltaan pohdittu GAS:n vahvuuksia ja heikkouksia. Kiresuk ja Sander esittelevät vielä muutamia keskeisiä GAS:n piirteitä erityisesti sosiaali- ja terveyspalveluiden (human services) näkökulmasta.

Mitä GAS voi tarjota. GAS on osoittautunut hyödylliseksi tavaksi arvioida tavoiteorientoituneiden palveluiden tuloksia. GAS:n skaalojen sisällöllinen analyysi tarjoaa käyttökelpoisia tiivistelmiä hoito-ohjelmien tavoitteista ja saavutuksista. Näitä voidaan käyttää mm. hallinnollisessa ohjauksessa, laadunvalvonnassa, rahoituksen suuntaamisessa ja tiedottamisessa. Lisäksi GAS-arvot tuottavat tietoa työntekijöiden ja hoito-ohjelmien tuloksista, ja sopivalla tutkimusasetelmalla voidaan tehdä myös vertailuja eri viitekehysten ja työvoiman tarpeiden välillä. GAS on yleisesti käytössä hoidon osana, ja sen seurauksena on havaittu myös hoidon tulosten kohenemista. Tavoitteiden ja niiden tulosten arviointi antaa myös mahdollisuuden suunnata palveluita väestöryhmille, joilla on riski saada alimitoitettuja palveluita. Lopuksi Kiresuk ja Lund huomauttavat, että GAS:ista on olemassa lukuisia sovelluksia, jotka tarjoavat ratkaisuja yleisesti koettuihin arvioinnin tarpeisiin.

Mitä GAS ei voi tarjota. GAS ei toimi diagnostisena tai muuna asiakkaiden luokittelun välineenä. Sen hyödyt ovat muutoksen mittaamisessa, hoidon ja hoito-ohjelmien aikaansaannosten kuvaamisessa ja hoidon tukemisessa. Sen lisäksi Kiresukin jaLundin mielestä tarvitaan luultavasti muitakin mittareita, mm. diagnostisia ohjeita, tarkistuslistoja ja talouden seurannan mittareita. Tavoitteet eivät myöskään voi korvata ongelmien kuvaamista silloin, kun se on tarpeen.

Vaihe 3: Hyväksynnän aikaansaaminen (Initial Adoption)

24

Kiresuk ja Lund toteavat, että yleisesti ottaen minkä tahansa uuden menetelmän käyttöönotossa on organisaatiossa useimmiten varauduttava vastaamaan seuraavanlaisiin kysymyksiin.:

1. Mihin tarpeeseen menetelmällä yritetään vastata?2. Onko se todella tarpeellinen?3. Miksi juuri tämä menetelmä?4. Onko kyseessä jälleen uusi hullutus, muoti-ilmiö?5. Onko muita vaihtoehtoja?6. Entäpä jos se maksaa meille rahaa, aikaa, vapauden rajoituksia tai tuo haavoittuvuutta?7. Onko siitä saatavilla apua vai maksetaanko tämä selkänahasta?8. Kuka on puolesta ja kuka vastustaa?9. Kuinka tämä toteutetaan käytännössä ja otetaan käyttöön?10. Mitä tapahtuu, ellen ole mukana?11. Mitä hyötyä siitä on minulle ja hoito-ohjelmalle?12. Onko tämä todella sen arvoista?

Vastaukset tulisi löytää paikallistasolla yhteistyössä työntekijöiden ja kouluttajien kanssa käyttäen apuna henkilöitä, jotka ovat olleet vastaavassa prosessissa mukana ja hyödyntäen kirjallisia materiaaleja, kuten tämä kirja. Hyväksynnän aikaansaamiseen löytyy erilaisia menetelmiä, joista Kiresuk ja Lund esittelevät (ss. 121 – 122) AVICTORY-mallin. Esimerkkinä käytetyssä sairaalaympäristössä merkillepantavia asioita olivat muutosta ajavan henkilön (tässä tapauksessa johtajan) ja muun henkilökunnan erimielisyys organisaation valmiudesta muutokseen ja erimielisyys siitä, että oliko kaikki tarpeellinen otettu muutosta valmisteltaessa huomioon. Tässä tapauksessa tietoisuus näistä erimielisyyksistä helpotti kouluttajan työtä koulutusseminaareita valmisteltaessa. Kiresuk ja Lund suosittelevat kaikissa GAS:n käyttöönoton yhteyksissä vastaavaa valmistautumista, jotta vähennettäisiin hukkatyötä, vältettäisiin ilmeiset virheet ja saataisiin sovitettua käyttöönotto organisaation toimintaan.

Vaihe 4: käyttöönotto

GAS:n onnistuneeseen käyttöönottoon ei Kiresukin ja Lundin mukaan ole olemassa erityisiä temppuja – missä tahansa muutoksessa tulevat esiin samat asiat ja tarvitaan samanlaisia hallinnollisia menetelmiä ja johtamista. Käyttöönotossa on aina yhteisiä hallinnollisia piirteitä. Odotettavissa on aina muutoksia käytännöissä ja erilaisia sopimusneuvotteluita. Riippuen organisaation luonteesta luodaan ongelmientunnistus- ja –ratkaisumentelmiä tai jo olemassa olevia mukautetaan muutoksen eteenpäinviemiseksi. Käytännön muutokseen liittyviä keskusteluita käydään työkokouksissa, mutta myös epävirallisissa tilanteissa kuten kahvitauoilla tai lounailla käydään asiaan liittyviä, tärkeitä keskusteluita. Mukana on henkilöitä, jotka lähtevät muutokseen nopeasti, ja heidän menestymisensä menetelmän käytössä on onnistumisen kannalta erittäin tärkeää. Epävirallisen organisaation merkitys muutoksessa on suuri. Kiresuk ja Lund antavat muutamia nyrkkisääntöjä, joista voi olla hyötyä käyttöönotossa.

1. Käyttöönoton tulee olla aktiivinen prosessi – passiivinen materiaalin jakaminen ei motivoi muutokseen.

2. Käyttöönoton valtuutus. Mikäli käyttöönoton puolestapuhuja ei ole organisaation ylimmästä johdosta, on välttämätöntä antaa tälle selkeät valtuudet viedä asiaa eteenpäin – käyttöönotolla on oltava johdon selkeä tuki.

25

3. Muun tuen hankkiminen. Muutoksessa voi joku työntekijä/ryhmä saavuttaa tai menettää jotain. Siksi on tärkeää saada tuki myös esimerkiksi tieteenalan päälliköiltä, käytännön työntekijöiltä, jotka toteuttavat tavoitteidenasettelua ja hallintohenkilöstöltä, jotka voivat joutua perustelemaan ja hyväksymään resurssien suuntaamista uudelleen.

Yksi tapa toimia on perustaa käyttöönoton yhteyteen ohjausryhmä, jonka tavoitteena on toteuttaa ja seurata käyttöönottoa. Ohjausryhmän on otettava vähimmillään kantaa seuraaviin kysymyksiin:

a. Ketkä toteuttavat käytännön tavoitteiden asettelua?b. Minkälaisia tavoitteita skaalataan?c. Minkälaista koulutusta tarjotaan?d. Kuinka GAS:n tekninen laatu varmistetaan?e. Koska ja miten seuranta ja pisteytys toteutetaan?f. Keille annetaan palautetta?g. Missä muodossa palaute annetaan?

Myös menetelmään kriittisesti suhtautuvia olisi Kiresukin ja Lundin mielestä syytä olla ohjausryhmässä.

4. Riittävien resurssien turvaaminen. Tämä on kirjoittajien mielestä ilmeinen askel mutta lyödään usein laimin. Ellei riittävästi panosteta käyttöönottoon, on todennäköistä että perinne ja pysähtyneisyys pitävät yllä entistä toimintaa. Suurin pulma on henkilöstön ajan jakaminen. Useinkaan ei ole mahdollista palkata uutta henkilökuntaa ja henkilöstöresurssi on viritetty äärimmilleen. Työnjaollisilla toimilla, esimerkiksi siirtämällä joitakin tehtäviä toimistohenkilökunnalle voidaan vapauttaa resursseja käyttöönottoon.

5. Vastarinnan käsittely. Muutosvastarinta ei Kiresukin ja Lundin mielestä ole väistämätöntä mutta jos sitä esiintyy, on siihen välttämätöntä puuttua mahdollisimman nopeasti. Yksi yleinen huoli liittyy tavoitteiden arvioinnin käyttöön hoito-ohjelman tulosten arvioinnissa. Saatetaan olla sitä mieltä, että kaikkia kliinisiä tavoitteita ei voida ilmaista määrällisesti tai ainakaan riittävällä tarkkuudella ennustaa niiden toteutumista määrättyyn ajankohtaan mennessä. Vaikka kirjallisuuden perusteella tavoitteet ja tulokset on mahdollista ilmaista määrällisesti, voi olla tarpeen vielä perehtyä käytännön sovelluksiin kenttätyössä muiden käyttäjien työhön tutustumalla tai kokeilemalla muutaman asiakkaan kanssa käytännössä. Jonkin verran huolta voi tuottaa myös ajatus siitä, että tuloksia voidaan käyttää henkilökunnan tehokkuuden tai ammattitaidon arvioinnissa. Myös tähän huoleen on syytä vastata käyttöönoton yhteydessä tavalla tai toisella – Kiresukin ja Lundin mielestä yksi tapa toimia on tuoda esille arvioinnin tarvetta koko organisaation toiminnan ja jatkuvuuden näkökulmasta, jolloin mm. huoli työpaikan menetyksestä voi helpottaa.

6. Tiedottaminen. Tämä on kirjoittajien mielestä aina tiedostettu mutta usein riittämättömästi toteutettu osa käyttöönottoa. Hyvässä tiedotuskäytännössä tunnistetaan ja käsitellään ongelmia, pidetään osallistuja ajan tasalla, tuotetaan osallistumisen tunnetta ja luodaan kanavat parannusehdotuksien käsittelylle. On virheellistä olettaa, että mikäli ei esiinny ilmeisiä ongelmia, asiat ovat hyvällä tolalla.

7. Henkilöstön osallistumisen rohkaiseminen. Tässä yhteydessä Kiresuk ja Lund pitävät erityisen tärkeänä edelläkävijöiden tukemista. Esimerkiksi juuri käyttöönotossa eteen tulevien ongelmien ratkaisemisessa heidän panoksensa voi olla ratkaiseva. Henkilöstön osallistamisella voidaan myös välttää yleinen kokemus siitä, että ”muualla keksitty ei voi olla hyvää”.

26

8. Koulutuksen tarjoaminen. Tämä on välttämätöntä niille, jotka toteuttavat tavoitteiden asettelua. Sen tulee sisältää menetelmän esittelyn ohella myös jatkuvaa palautetta ja ohjattua käyttöönottoa.

9. Kokonaiskuvan hahmottaminen. Kehityksen huumassa saattaa unohtua muutoksen pitkän aikavälin seuraamusten pohtiminen. Mikä tahansa muutos on sidottava organisaation pitkän tähtäimen kehitystarpeisiin ja sidottava toimintaympäristöön vuosien kuluessa. Taantumat käyttöönotossa ovat tavallisia ja voivat liittyä ammattikuntien tai ikäpolvien välisiin erimielisyyksiin tai muutosta vastustavien näkemysten riittämättömään kuulemiseen. Lyhyellä tähtäimellä muutoksia on kenties helppo saada aikaan, mutta pidemmällä tähtäimellä niiden voi arvioida vakiintuneen vasta, kun kokeneimmatkin ammattilaiset – joilla on arvovaltaa ja uskottavuutta - ovat ne hyväksyneet ja soveltavat niitä käytännössä.

Vaihe 5: GAS:n ylläpitäminen

Kiresuk ja Lund toteavat, että minkä tahansa uuden toimintatavan vakiinnuttaminen edellyttää tiettyä määrää johdon huomiota. Onnistuneen alun jälkeen voidaan olettaa, että muutos on tapahtunut ja sujuu ikään kuin itsestään. Toiminnan vakiinnuttamiseksi kannattaa kuitenkin soveltaa muutamia hyviksi koettuja tekniikoita.

1. Pidetään yllä jatkuvaa keskustelua, jolloin tavanomaisissa tiimikokouksissa arvioidaan GAS:ia ja asetetaan uusia päämääriä. Lisäksi voidaan järjestää erillisiä johdon ja henkilöstön välisiä kokouksia, joissa arvioidaan käyttöönoton tilannetta ja johdolla on samalla mahdollisuus tiedottaa jatkosuunnitelmista ja –tavoitteista. Myös eri toimijoiden välisiä seminaareja – esimerkiksi GAS:n käyttäjien ja tavoitteiden arvioitsijoiden – kannattaa organisoida. Yleisesti järjestetään myös seminaareja työpaikan ulkopuolella, joissa voidaan arvioida organisaation tarpeita, jakaa kokemuksia ja tunnistaa uusia kehityksen suuntia. Lisäksi voidaan ajoittain pyytää ulkopuolisia asiantuntijoita vierailemaan ja ohjaamaan ongelmanratkaisussa, kehittämään uusia näkökulmia ja avuksi suunnittelemaan jatkokehittelyä.

2. Selkeytetään valtuudet. Määrätyn henkilön tai ryhmän tulisi olla vastuussa käyttöönoton toteuttamisesta. Tässä yhteydessä on hyödynnetty arviointiryhmää tai määrätty erillinen arvioitsija. Oleellista on, että asianosaisilla on riittävästi aikaa ja valtuuksia puuttua ongelmiin silloin, kun niitä ilmaantuu.

3. Annetaan palautetta. GAS:n laadun ylläpitämisessä on useissa yhteyksissä jaettu saatua informaatiota palautteena toiminnan toteuttajille. Tuloksista saadun tiedon on havaittu parantavan toimintaa. Organisaation toimintakulttuurista riippuen on voitu käyttää myös symbolisia tai taloudellisia kannustimia.

4. Otetaan huomioon muunnokset. Osa GAS:iin liittyvästä polemiikista on liittynyt menetelmän Kiresukin ja Shermanin alkujaan (1968) jälkeen syntyneiden sovellusten täsmällisyydestä. Jäljempänä mittaamiseen liittyvissä kappaleissa tähän teemaan palataan. Tiivistettynä voidaan kuitenkin todeta, että organisaation tarpeet ja raportoinnin vaatimukset on tässä yhteydessä arvioitava ja mikäli tavoitteena on linkittää raportointi aikaisempaan GAS:ia koskevaan tutkimukseen, on syytä pitäytyä tämän kirjan suosituksissa. Lisäksi GAS:ille ominainen joustavuus johtaa väistämättä jonkinlaisiin muunnoksiin ja GAS:in raportointia on yleisesti yhdistetty esimerkiksi ongelmakeskeisiin asiakirjoihin tai tavoitesuuntautuneisiin hoitosuunnitelmiin. Kuitenkin missä tahansa sovelluksessa on oltava takeet riittävästä laadusta – sen kriteerit riippuvat siitä kenelle laadukkuutta on tarpeen perustella.

27

Lopuksi Kiresuk ja Lund määrittelevät käyttöönoton kustannuksia, jotka koostuvat välittömistä kuluista – materiaalikustannuksista ja koulutuksesta sekä hallinnoinnista ja pisteyttämisen kustannuksista. Lisäksi on otettava huomioon ylläpidon vaatimat kustannukset, joihin kuuluu laadunvalvonta, asiakirjojen ylläpitäminen ja osaamisen ylläpito. Kokemusten mukaan GAS:n käyttöönoton kustannukset kestävät vertailun – varsinkin kyseessä olevan toiminnan muutoksen määrään nähden – muihin menetelmiin. Metodologisina pulmina kuitenkin GAS:ia sovellettaessa on syytä pitää mielessä, että kaikki organisaatiot ovat olleet mukana oma-aloitteisesti ja hyvinkin erilaisia organisaatioita on ryhmitelty yhteen, vaikka niillä on voinut olla toisistaan poikkeavia arvioinnin tarpeita. GAS:n ohella on myös sovellettu muita arviointimenetelmiä, ja GAS:n puhtaus on vaihdellut eri yhteyksissä. Myös käyttöönoton menetelmät ovat vaihdelleet huomattavasti. Myöskään vertailevia tutkimuksia eri arviointimenetelmiä soveltavien organisaatioiden kesken ei ole tehty. Lisäksi ei useinkaan ole ennakolta määritelty kriteereitä onnistumiselle, vaan pikemminkin sovelluksen käytön jatkumisesta on muotoutunut epäsuora merkki onnistumisesta. Yllättäviä vaikutuksia, esimerkiksi GAS:in kielteisiä tai myönteisiä vaikutuksia organisaatioon ei ole Kiresukin ja Lundin mukaan missään yhteydessä arvioitu. GAS:n omaksuminen, käyttöönotto ja vakiinnuttaminen ovat sulautuneet yhdeksi kokonaisuudeksi, jota ei ole arvioitu vaiheittain. Viimeiseksi Kiresuk ja Lund huomauttavat, että analyysejä on tehty ainoastaan niistä organisaatioissa, jotka ovat pysyttäytyneet kontaktissa tutkijoihin. Näistä syistä ei ole varmuutta siitä, millä perusteilla organisaatiot ovat päättäneet jatkaa tai olla jatkamatta GAS:n käyttöä.

7. Historiallinen katsaus ss. 135 – 160

Thomas J. Kiresuk

Kiresuk pyrkii historiakatsauksessa vastaamaan GAS:n syntyyn liittyviin sosiaalisiin, poliittisiin ja hallinnollisiin kysymyksiin. Juuri hallinnolliset tarpeet ja ohjelmien arvioinnin tarpeet vaikuttivat suuresti GAS:n muotoon ja sen soveltamisen tyyleihin. GAS:n historiallisessa kehityksessä vaikutti vahvasti kaksi pääteemaa: menetelmän paikalliseen käyttöön liittyvät kysymykset ja liittovaltion antama sysäys menetelmän nopeaan levittämiseen erityisesti mielenterveystyön kehittämisessä.

Historiallisesti mielenterveystyön laajenemisen taustalla vaikuttivat Kiresukin mukaan toisen maailmansodan aikaiset havainnot asevelvollisten ja siviilien suuresta mielenterveyspalveluiden tarpeesta. 1950- ja 1960-luvuilla psykiatrian puolella vallitsi Kiresukin mielestä itsetyytyväinen elitismi, joka ei antanut sijaa hoidon tulosten arvioinnille. Mielenterveyspotilaiden hoitokin oli pitkään lääketieteelliseen sairausmalliin perustuvaa ja hoitomuodot olivat enimmäkseen lääkinnällisiä tai fysikaalisia. Hoito oli myös lääkärikeskeistä ja hoito-organisaatiot voimakkaan hierarkkisia. Lisäksi laitoshoitoa käytettiin paljon, ja laitokseen joutumisen jälkeen kotiutuminen oli suhteellisen vaikeaa. Potilaiden oikeuksista ei juuri puhuttu tai otettu niitä huomioon. Kustannuksia arvioitiin laskettuina henkilöä kohden ja hoidosta vastaavien valtiollisten organisaatioiden määritteleminä. Käytännössä hoidon vaikuttavuutta ei juuri arvioitu. Ennen pitkää, mm. median laitoshoitoa käsittelevän kritiikin myötä alkoi syntyä laajeneva tarve saada aikaan muutoksia ja ratkaisuja mielenterveystyön ilmeisiin ongelmiin. Hoitomenetelmät alkoivat hiljalleen muuttua humaanimmiksi ja lääkkeet kehittyivät paremmiksi, joka sekin osaltaan muutti hoitohenkilökunnan toimintaa. Lisäksi alettiin kokeilla vaihtoehtoja laitoshoidolle, ja mm. avohoito ja terapeuttiset yhteisöt

28

herättivät laajaa kiinnostusta. Kiresuk kertoo, että GAS:n toivottiin näissä oloissa osaltaan toimivan muutoksen käsitteellisenä vipuna, vaikka toisaalta voi sen ajatella syntyneen sopivasti kehityksen suunnan muuttuessa jo muutenkin.

Tulosten arvioinnin näkökulmasta Kiresuk pitää tätä vaihetta (1950 – 1960-luvuilla) mielenkiintoisena, koska todistustaakka hoidon tehokkuudesta näytti olevan potilaalla eikä palveluntarjoajalla. Näin ollen sairaalan asiakirjoissa ei todettu, että hoito epäonnistui vaan että potilas ei enää hyötynyt terapiasta. Kiresuk huomauttaa, että yksittäisten terapeuttien tehokkuus on vielä nykypäivänkin enimmäkseen tuntematonta aluetta. Mm. psykologiassa, jossa kaikenlaista kyvykkyyttä mitataan rutiininomaisesti määrällisillä ja laadullisilla mittareilla opiskelijat valmistuvat terapeuteiksi Kiresukin mielestä edelleen ilman, että on käytettävissä vakiintuneita arvioinnin mittareita ja sama pätee heitä kouluttaviin henkilöihin. Ennen, kun nykyisenkaltaista taloudellisen tehokkuuden velvoitetta ei ollut, oltiin vielä vähemmän kiinnostuneita määrittelemään tuloksellisuuden mittareita. Arviointia toki toteutettiin mutta mittareista oli vaikeaa kehittää yksitulkintaisia tai eri terapiasuuntien kesken vertailukelpoisia. Ensimmäiset arviointikäytännöt perustuivat Kiresukin mukaan satunnaisesti ja epämääräisesti kerättyyn tietoon, jota kylläkin käsiteltiin asiallisin tilastollisin menetelmin. Kuitenkin esimerkiksi käsitteiden määrittely oli epätarkkaa, joten eri arviointien tulosten vertaileminen keskenään oli jo tämänkin takia hankalaa. Mielenterveyspalvelut kasvoivat kuitenkin voimakkaasti, ja vaikka taloudellisia resursseja 1960-luvulla vielä riitti hyvin, alkoivat poliittiset päättäjät hiljalleen kiinnostua yhä enemmän myös palveluiden vaikuttavuudesta. Mielenterveysalan ammattilaiset joutuivatkin lopulta tiukkoihin puolustusasemiin, joissa tiedonkeruusta tuli laatukontrolloitua ja henkilöstön tehtävät ja tuottavuus tiedettiin yksityiskohtaisesti. Tällainen seuranta vei aikaa ja oli kömpelöä mutta palveli hyvin puolustautumistarkoitusta, ja henkilöstö suhtautui siihen myönteisesti. Kiresuk työskenteli tuolloin Hennepin County Mental Health Centerissä, jossa em. arviointimenetelmien pohjalta huomattiin, että toiminta kesti vertailun muiden vastaavien yksiköiden kanssa.

GAS:n keksimisen alkusysäyksenä oli muutamia missä tahansa arvioinnissa huomioon otettavia rajoituksia. Ensimmäiseksi tulee koko julkisen terveydenhuollon toimijoiden heterogeenisyys, jossa lukuisat eri alojen ammattilaiset, eri tasojen hallinnon työntekijät, eri-ikäiset ja erilaisista ongelmista kärsivät potilaat, taloudelliset toimijat, koulutus ja tutkimus kohtaavat. Tällaisen toimijoiden kokonaisuuden yhteydessä oli epätodennäköistä, että löydettäisiin kaikkien tarpeita palveleva arvioinnin mittari. Toiseksi hoito-ohjelmien arviointia alettiin kehittää oloissa, joissa vallitsivat kilpailu, tinkiminen, asianajo, testaaminen ja vaikutusvallan rajojen hakeminen. Arvojärjestelmät saattoivat riippua ammatillisista valtuuksista, työpaikasta, rahoituslähteestä, poliittisista kytköksistä, tuen saamisesta tai puuttumisesta määrätyltä henkilöltä tai instituutiolta tai vaikkapa sosiaalisesta tai poliittisesta asemasta. Näissä oloissa myös omien sidonnaisuuksien ottaminen huomioon – ei niinkään se, että oliko niitä vai ei – tuli myös keskeiseksi.

Mittausongelmien ratkaisemiseksi hallinnon edustajat ja arvioijat tutkivat esimerkkiorganisaatioita, ja Hennepinissä tutkittiin perusteellisimmin päiväkeskusta. Arviointia tehtäessä potilaiden moninaiset tarpeet ja onnistuneen hoidon variaatiot ja tulosten vertailtavuuden haasteet tulivat selkeästi esille. Tämän tiedon valossa Kiresuk kertoo havainneensa, että millään olemassa olevalla mittarilla ei ollut mahdollista arvioida hoidon seuraamuksia. Kuitenkin näytti siltä, että tapauskohtaisesti olisi mahdollista kehittää järkeviä ja uskottavalta tuntuvia odotuksia, joita voisi pisteyttää. Ongelmana oli kuitenkin se kenen näkökulmasta tavoitteita tulisi asettaa. Ilman selkeitä sopimuksia tästä käytäntönä oli se, että päätöksiä tavoitteista tekivät pienet piirit joko sairaalayhteydessä tai lainsäädännössä. Tämän takia ammatillinen tai julkinen

29

arviointi ei ollut mahdollista. Kriteereiden asettelu oli Kiresukin mielestä edelleen lääketiede- ja lääkärikeskeistä, ja potilasnäkökulma puuttui kokonaan.

Sen sijaan, että näissä olosuhteissa olisi luovutettu tai valittu lukuisista mahdollisista mittausmenetelmistä joku, päädyttiin siirtämään vaikutusten arviointi toiminnan toteuttajille. Suuntaa lähdettiin etsimään siitä, kuinka terapeutit itse parhaiten pystyisivät arvioimaan terapian vaikutuksia. Ensimmäiset kokeilut olivat kömpelöitä ja pyrkimyksenä oli aluksi listata kaikki mahdolliset ongelmat ja tavoitteet, joita potilailla oli. Tämä osoittautui nopeasti mahdottomaksi, koska ongelmien määrä saattoi olla hyvinkin suuri. Yhdistelemällä ja tiivistämällä ongelmia päästiin pienempiin määriin mutta vasta, kun huomattiin ryhtyä kirjaamaan mahdollisia, vaihtoehtoisia tuloksia hoidolle päästiin alkuun yksilöllisten tulosten määrällisessä ilmaisussa. Ensimmäinen GAS:ia koskeva tieteellinen artikkeli, ”Goal Attainement Scaling: A General Method for Evaluating Community Mental Health Programs” (Kiresuk&Sherman), julkaistiin vuonna 1968.

Menetelmän jatkokehittelyssä Kiresukia pohditutti ensinnäkin se, että lähtisivätkö yleensä mittaamiseen ja tilastotieteeseen varauksellisesti suhtautuvat mielenterveystyön ammattilaiset käyttämään GAS:ia. Menetelmää ryhdyttiin kuitenkin käyttämään varsin nopeasti, jolloin seuraava pohdinnan aihe oli se, että minkälaisia sisältöjä käyttäjät skaaloille valitsisivat ja olisivatko ne relevantteja mielenterveystyössä. Tämäkin näytti toteutuvan, ja seuraava huoli liittyi siihen olisivatko tavoitteet kullekin potilaalle soveltuvia. Myös tämä kysymys näytti ratkeavan suotuisasti. Ensimmäinen, 402 potilaan pisteistä tehty analyysi osoitti, että kliinikot tosiaan pystyivät mielenterveyskontekstissa tekemään tarkkoja ennusteita tuloksista. Reliabiliteettiä, validiteettiä ja herkkyyttä eroavaisuuksille koskevat jatkotutkimukset eivät kuitenkaan antaneet täyttä varmuutta GAS:n toimivuudesta, vaikka tulokset olivatkin useissa tutkimuksissa hyvin rohkaisevia, joten menetelmää ryhdyttiin levittämään laajemminkin 1970-luvun aikana. Tässä vaiheessa GAS kehittyi heterogeenisissa ympäristöissä moniulotteisen väittelyn ja keskustelun kautta. Tässä yhteydessä Kiresuk ja hänen työtoverinsa kiertelivät luennoimassa ja tukemassa menetelmän ”uudelleen keksimistä” eri puolilla valtakuntaa. Tällaista levittämisen tapaa Kiresuk pitää poikkeuksellisena, ja arvioi GAS:n luonteeseen ja sen vahvuuksiin ja heikkouksiin liittyvän sekaannuksen olevan peruja juuri tällaisesta toimintatavasta, jossa tiedottaminen kohdentui mahdollisiin käyttäjiin, eikä niinkään osallistuttu tieteelliseen debattiin.

8. Käsitteellinen tausta ss. 161 – 171

Thomas J. Kiresuk

GAS on yksi menetelmä suuressa joukossa arviointimenetelmiä, jotka pyrkivät tuomaan esille ja määrittelemään odotettavissa olevia seuraamuksia määrätyille toiminnoille. Kiresuk johtaa GAS:n syntyjuuret 1950- ja 1960-luvuilla yliopistojen psykologian laitoksilla syntyneisiin ajatuksiin. GAS:n filosofiset perustukset löytyvät psykologisista mittareista ja palvelutuotannon arvioinnista. Kiresuk toteaa, että yleinen käsitys on, että inhimillinen ajattelu ja toiminta perustuvat tarkoituksellisuuteen, jolloin niiden ymmärtäminen on mahdollista, kun onnistutaan tavoittamaan tarkoituksellisuuden ydin. Tämän ajatuksen pohjalta arviointiin liittyvää keskustelua on käyty, ja siihen arviointia toteuttavien verkostot ovat pohjautuneet.

30

Varsinaisen sosiaali- ja terveyspalveluiden (human services) arvioinnin Kiresuk näkee saaneen alkunsa 1900-luvun alkupuolella Wardin (1906), Chapinin (1917) töiden ja samanaikaisen johtamistieteiden (Taylor 1911) kehityksen myötä. Druckerin (1954, 1964) ja Odiornen (1965) myötä tekninen ratkaisu, ’tavoitejohtaminen’, (Management by Objectives) tuli suosituksi ja laajalti sovelletuksi. Myös psykiatriassa, näköjään edellisistä riippumatta, syntyi samanlaisiin ydinajatuksiin pohjautuvia innovaatioita. Näistä esimerkiksi Jerome Frankin ja hänen kollegoidensa työ kohdentui potilaiden hoidolle asettamiin odotuksiin. Myös kasvatuksessa, edelleen nähtävästi edellisistä riippumatta, syntyi tavoitesuuntautunutta arviointia (Tyler 1949).

Kiresuk toteaa, että näennäisestä keskinäisestä riippumattomuudesta huolimatta edellä mainituilla ratkaisuilla on yhteinen käsitteellinen tausta. Ajatus inhimillisen käyttäytymisen ja ajattelun tavoitteellisuudesta yhdistää näitä kaikkia. Toiseksi tavoitteiden arviointiin liittyy oleellisesti prognoosin (ennuste, ennakkoarvio) käsite. Tästä voidaan johtaa ajatus hoidon odotetusta tuloksesta, joka GAS:n yhteydessä on nykylääketieteen käsityksen mukaan itsestään selvää. Kiresuk uskoo, että juuri näiden kahden käsitteen yhdistelmä useissa eri ammattiyhteyksissä käytettynä on johtanut tavoitteiden asettelun yleistymiseen arvioinnissa ja laadun tarkkailussa. Esimerkiksi tavoitesuuntautunut hoitosuunnitelma (goal-oriented nursing care plan) on jo pitkään ollut pääsuuntaus hoitoalan koulutuksessa ja vakiintunut lääketieteellinen tietojen säilyttämisen tapa. Samanlaisia menetelmiä on monilla muillakin erikoistumisaloilla, kuten riippuvuuksien hoidossa, vankeinhoidossa ja käyttäytymisterapioissa.

Näiden ohella GAS:n syntyyn vaikutti se, että samoihin aikoihin alettiin yleisesti soveltaa tilastollisia menetelmiä psykologiassa ja sosiaalitieteissä. Tämä suuntaus vahvisti GAS:issa piirteitä, jotka liittyivät odotetun tuloksen määrittelemiseen ennalta vastakohtana yleiselle tutkimusstrategialle, jossa pyrittiin etsimään ennen-jälkeen eroavaisuuksia. Tilastotieteellinen keskustelu vaikutti muutenkin GAS:n taustalla, ja erityisesti se herätti tarpeen yhä tarkempaan hoidon tulosten ennakointiin tai ennustamiseen. Kiresuk huomauttaa, että ei riittänyt, jos voitiin todeta, että asiakas paranee tai hänessä tapahtuu tilastollisesti arvioitavia muutoksia useilla osa-alueilla. Pikemminkin syntyi paine määritellä tarkkaan millä alueilla ja miten paljon muutosta olisi odotettavissa nimenomaan intervention eikä luonnollisen muutoksen tai sattuman seurauksena. Erityisesti Bayesin analyysimentelmillä oli huomattava vaikutus GAS:n taustalla varsinkin asennoitumisessa ja lähestymistyylissä – ei niinkään metodin suorassa soveltamisessa. Kukin tavoitteiden saavuttamisen asteikko (Goal Attainement Scale) voidaan nähdä Kiresukin mielestä todennäköisyyksien jakaumana, jossa todennäköisin vaihtoehto on kuvattu keskellä odotettuna tuloksena. Vähemmän todennäköiset, mutta mahdolliset negatiiviset ja positiiviset vaihtoehdot esitellään jakauman ääripäinä (”are exhibited in the tails of the distribution”). Kiresuk myöntää, että tilastotieteellisesti GAS:n kehityksen alkuvaiheissa käytetty terminologia on vähintäänkin epätäsmällistä. Luvun tarkoituksena on kuitenkin kuvata GAS:n kehityksen alkuvaiheissa vallinnutta älyllistä ilmapiiriä ja menetelmiä. Nämä käsitteelliset juuret mahdollistivat myös myöhemmin vuorovaikutuksen myöhemmin kehittyneiden tavoitteiden arvioinnin teorioiden kanssa (Edwards, Lindman&Savage 1963 & Guttentag 1973: decision theoretic methodology ja McClelland&Winter: goal-oriented method of evaluating economic achievement motivation.)

GAS:n suhdetta psykologisiin testeihin (mental testing) on Kiresukin mielestä huomattavan vaikeaa kuvata. GAS:lla ei ollut ilmeistä edeltäjää, mutta sitä täytyi yhtä kaikki suhteuttaa olemassa oleviin mittareihin ja standardeihin, jotka olivat hyvin erilaisia sisällöltään ja tarkoitukseltaan. Minnesotassa eniten käytetty psykometrinen väline oli GAS:n synnyn aikoihin MMPI (Minnesota Multiphasic Personality Inventory). Ideologista kamppailua käytiin projektiivisten testien ja objektiivisten testien välillä. Kummankin tyyppisten

31

testien tehtävänä oli auttaa diagnoosien tekemisessä, auttaa ymmärtämään asiakkaiden ongelmia ja vaikuttaa terapiaan. Kaikissa testeissä oli sisäänrakennettuna kyky havaita muutosta. Tuohon aikaan oli Kiresukin mukaan luonnollista nähdä hoidon arviointi ennen-jälkeen mittauksina käytettäessä mitä tahansa mittaria. Muutoksia mitattiin esimerkiksi älykkyystesteillä, hahmottamistesteillä, persoonallisuustesteillä tai oireiden määrällisillä asteikoilla. Tuloksia tulkittiin sekä kvantitatiivisesti että intuitiivista ja kliinistä kokemusta arvostavilla kehyksillä. Yksilötasolla eroilla näiden mittareiden asteikoilla näytti usein olevan yhteyttä muutoksiin, mutta yleisesti ottaen paljon ääntä pidettiin pienistä kvantitatiivisista eroista.

Kliinisen raportoinnin traditio pohjautui potilaskertomuksiin, joiden muoto oli peruja Freudin ja muiden psykoanalyyttisten kirjoittajien teksteistä. Kiresuk toteaa, että lisäämällä potilaskertomuksiin kvantitatiivista aineistoa niihin saatiin lisää tieteellistä vakuuttavuutta. Hänen mielestään potilaskertomukset muistuttivat kuitenkin sisällöltään salapoliisitarinoita, joissa jännitysmomentti piili oireita aiheuttavien syiden ja diagnoosien löytämisessä ja oireiden synnyn selittämisessä. Kiresukin mielestä kiinnostusta elämänlaadun lisäämiseen riitti vähän lukuun ottamatta haitallisten oireiden hoitamista. Nykyinen käytäntö on Kiresukin mielestä lisätä näihin kliinisiin salapoliisitarinoihin potilaiden sosiaaliseen ja kulttuuriseen taustaan liittyvää tutkimustietoa ja talonpoikaisviisautta. Psykologiset testit sopivat Kiresukin mielestä tähän asetelmaan siksi, että ne voimistivat palveluiden professiota, auttoivat ratkaisemaan diagnostisia arvoituksia ja satunnaisesti antoivat mahdollisuuden ennustaa hoidon tuloksia. Kun painopiste arvioinnissa siirtyi terapeuttien työn vaikuttavuuden tutkimiseen, havaittiin näiden menetelmien heikot kohdat.

Syitä siihen, että psykometrisen mittaamisen traditiosta siirryttiin hoidon vaikuttavuuden arviointiin, on Kiresukin mukaan useita. Yhtenä syynä oli se, että ei ollut varmuutta siitä, sisältyikö hoidon ennakoitava tulos jo käytössä oleviin mittareihin. GAS:iin voitiin sisällyttää minkä laisia tahansa sisältöjä, joten odotettavat tulokset saattoivat olla joko testituloksia tai tavoitteita, jotka olivat eri osapuolten yhdessä asettamia. Tällaisen odotettujen tulosten rykelmän suhteuttaminen psykometrisiin teorioihin ja standardeihin oli ongelmallista. Kaikki psykologiset mittarit sisältävät ehdon, että ne ovat käyttäytymisen otoksia, jotka on valittu niin, että ne ennustavat tai ovat suhteessa muuhun käyttäytymiseen tai persoonallisuuden piirteisiin. Ensimmäinen toimenpide mittarin laatimisessa on mittarin sisällön määrittely. GAS:issa ei ole ennalta määriteltyä sisältöä, joten se ei ole psykometrinen mittari termin tavanomaisessa merkityksessä. GAS:issa täytyy kuitenkin samalla tavalla kuin määritellyn sisällön omaavissa psykometrisissä mittareissa riittävästi määritellä skaalojen luonne, reliabiliteetti ja validiteetti. Tätä pulmaa mutkisti Kiresukin mielestä vielä se, että GAS:ia kehittivät biometrikot ja siihen vaikuttivat taloustieteilijät, jotka eivät olleet perillä psykologisten testien historiasta.

Luvun lopussa Kiresuk kuvaa vielä muutamia käännekohtia urallaan, jotka saivat hänet vieraantumaan aikakauden ”seremoniallisesta ja itsetyytyväisestä” ammattikäytännöstä. Ensimmäinen huomio oli opiskelijan laatimasta tapauskuvauksesta, joka perustui yhden potilaan 30 vuoden potilasasiakirjojen analyysiin. Hoidot vaihtelivat kävelyterapiasta (kävelyllä käynti) insuliini- ja sähkösokkeihin ja lobotomiaan. Hoidosta huolimatta potilaan vointi pysyi kutakuinkin samanlaisena. Tästä Kiresuk oivalsi, että kliininen arvio saattoi perustua vähäiseen tai olemattomaan seurantaan. Toinen tapauskuvaus vertaili kaikkien käytössä olleiden älykkyys-, neurologisten ja persoonallisuustestien ennen-jälkeen tuloksia. Esitys oli tilastotieteellinen, eikä herättänyt minkäänlaista keskustelua. Myöhemmin Kiresuk tutki väitöskirjassaan Rorshachin ja MMPI:n diagnostista tarkkuutta vertailemalla tuloksia valtion mielisairaalassa olevien paranoidisten skitsofreenikkojen ja tavallisten kansalaisten, jotka olivat samanikäisiä, samaa sukupuolta ja samaa ammattialaa edustavia. Kiresukia hämmästytti projektiivista testiä toteuttaneiden neljän asiantuntijan saama väärien positiivisten tulosten määrä. MMPI antoi huomattavasti vähemmän vääriä

32

tuloksia mutta niitä kuitenkin tuli. Johtopäätöksenä oli, että koehenkilöt valitsevat enemmän sairaita kuin normaaleja vastauksia. Toisessa yhteydessä lyhyt kokeilu, jossa potilaille itselleen annettiin diagnostinen käsikirja osoitti, että he pystyivät itse ilman asiantuntijan mukana oloa asettamaan oikeat diagnoosit. Tämä sai Kiresukin suhtautumaan yhä kriittisemmin ammattihenkilöiden asiantuntemukseen ja toisaalta uskomaan potilaiden mahdollisuuksiin osallistua diagnoosin asettamiseen. Viimeiseksi Kiresuk kertoo, että Minneapolisin hoitoalan oppilaitoksessa oli käytäntönä, että opiskelijoille ei annettu heidän MMPI-testin tuloksia nähtäväksi siinä pelossa, että sillä olisi epäsuotuisia vaikutuksia. Erästä vakiintunutta tutkimuslomaketta käyttäen Kiresuk pyysi opiskelijoita arvioimaan ennalta MMPI testin tuloksia ja huomasi, että ennakoinnit osuivat varsin hyvin yhteen testitulosten kanssa.

Edellä mainitut havainnot vaikuttivat Kiresukin ajattelussa siihen suuntaan, että vaikuttavuuden arviointi ja potilaiden entistä suurempi osallistuminen hoidon suunnitteluun alkoi kiinnostaa. GAS on Kiresukin mielestä väline, joka on riittävän avoin sovellettavaksi missä tahansa ympäristössä. Se pakottaa myös arvioimaan ja tuomaan esille hoidon taustalla piilevät arvojärjestelmät ja mahdollisen puolueellisuuden. Näiden tuominen esille on ollut myös merkittävä tavoite GAS:n kehittämisen taustalla.

9. Psykometriset näkökohdat ss. 173 – 212

Joseph E. Cardillo ja Aaron Smith

Psykometriset näkökohdat liittyvät tässä luvussa GAS:n nykyisissä käyttöyhteyksissä syntyvien pisteiden ominaisuuksiin. Luvussa käsitellään näin ollen asiakkaiden tavoitteiden arviointiin, hoito-ohjelmien vertailuun tai vaikuttavuuden arviointiin käytettävien GAS-arvojen summaamista. Tämän ymmärtämiseksi on Carcillon ja Smithin mielestä hyödyllistä tarkastella yksittäisten asiakkaiden skaalapisteiden ominaisuuksia. Aluksi kirjoittajat kuvaavat Kiresukin ja Shermanin (1968) pisteytyskäytäntöjä ja niille vaihtoehtoisia tapoja pisteiden summaamiselle. Kaikki menetelmät tuottavat samanarvoisia tuloksia, joten sopivan menetelmän valinta riippuu enimmäkseen käytön helppoudesta ja persoonallisista mieltymyksistä.

1. Summaamisen vaihtoehdot

T-arvon laskeminen perustuu siihen, että kussakin seurantataulukossa on viisiportainen asteikko, joista yhden arvioija pisteyttää asiakkaan arviointihetken tilanteen mukaan. Kiresuk ja Sherman (1968) esittivät seuraavan pisteytyksen kullekin viidelle portaalle:

-2 paljon vähemmän kuin odotettu tulos

-1 hieman vähemmän kuin odotettu tulos

0 odotettu tulos

+1 hieman enemmän kuin odotettu tulos

+2 paljon enemmän kuin odotettu tulos

33

Tämä asteikko on nykyisin laajalti hyväksytty, joskin eräät käyttäjät ovat negatiivisia arvoja välttääkseen käyttäneet asteikkoa 1 – 5. Kiresuk ja Sherman laativat GAS:n T-arvojen laskemista varten seuraavan kaavan:

T=50+10∑ wi x❑

√ (1−ρ )∑ w i2+ρ (∑ wi )

2

(kaava 9.1. s. 175)

Tässä x i on i:nnen seurantataulukon tuloksen pistearvo (outcome score for the i:th scale of the follow-up guide), w i on i:nnelle skaalalle asetettu numeerinen painoarvo ja ρ on skaalojen pisteiden painotettu keskinäinen korrelaatio. Kaava 9.1. sisältää oletuksen, että yksittäisillä skaaloilla (-2 ─ +2 –pisteytysasteikolla) on teoreettinen jakauma, jonka keskiarvo on nolla ja keskihajonta 1. Kaavaan tarvitaan yksilöllisten skaalojen pisteet (x i ), arvio skaalojen keskinäisestä korrelaatiosta ( ρ ) kyseisessä

seurantataulukossa (follow-up guide) ja useita laskutoimituksia skaalojen painoarvoista (wi ). Määrätyillä edellytyksillä tämän kaavan mutkikkuus voidaan kuitenkin välttää.

Mikäli kaikki skaalat painotetaan samanarvoisesti niin, että kaikki w i-arvot ovat 1, voidaan kaava kirjoittaa seuraavasti:

T=50+10∑ wi x i

√n−n ρ+n2ρ

(kaava 9.2. s. 175)

Tässä n on seurantataulukon skaalojen lukumäärä. Yhtälö 9.2. voidaan kirjoittaa muotoon

T=50+k∑ x i(kaava 9.3. s. 176)

jossa k on vakio, joka määritellään

k= 10√n−nρ+n2 ρ

(kaava 9.4. s. 176)

Vakio k riippuu skaalojen pisteiden keskimääräisestä keskinäisestä korrelaatiosta ja kunkin taulukon skaalojen määrästä. Kiresuk ja Sherman (1968) esittivät myös, että asettamalla ρ=.30 olisi mielenterveysyhteyksissä järkevää. Sherman (1974) osoitti, että jos ρ=.30 ja kukin skaala painotetaan samalla tavalla, supistuu kaava GAS:n T-arvon laskemiseksi

T=50+C (∑ xi)

(kaava 9.5. s. 176)

34

Tässä C on vakio joka riippuu ainoastaan seurantataulukon skaalojen lukumäärästä. Tämä kaava tuottaa T-arvoja, joiden keskiarvo on 50 ja keskihajonta 10 kun taustaehdot pitävät paikkansa ja skaalattavat tavoitteet pisteytetään käyttämällä -2 – +2 –asteikkoa. Kaavaa 9.5. käytettäessä tarvitsee ainoastaan laskea yhteen seurantataulukon skaalojen pisteet, kertoa summa C:n arvolla, joka vastaa taulukon skaalojen määrää ja lisätä tulokseen 50. Vielä yksinkertaisempi vaihtoehto on laskea skaalojen pisteet, kirjata skaalojen lukumäärä ja käyttää kirjan liitteessä A olevia taulukoita T-arvon määrittämiseksi.

Taulukko 9.1.

C:n arvot seurantataulukon eri skaalojen lukumäärillä (.176)

C:n arvo Skaalojen lukumäärä10.00 16.20 24.56 33.63 43.01 5

Huom: C:n arvot sisältävät oletuksen, että kaikki skaalat painotetaan samalla tavalla niin, ettäρ=.30

Periaatteessa mikä tahansa muukin tapa kuvata skaalojen pisteiden keskiarvojen lineaarista transformaatiota on yhtä käyttökelpoinen kuin T-arvo – Kiresuk ja Sherman ottivat sen käyttöön, koska arvioivat sen olevan ennestään tuttu mielenterveysalan ammattilaisille. Lisäksi sen avulla vältetään negatiiviset yhteenlasketut pisteet. T-arvon vaihtoehtona voidaan hyvin käyttää myös skaalojen pisteiden keskiarvoa (average scale score), jonka kaava on:

Average Scale Score=∑ x in

(kaava 9.6., s. 177)

Tässä n on skaalojen lukumäärä. Arvo lasketaan siis laskemalla yhteen yksittäisten pisteiden arvot ja jakamalla ne skaalojen lukumäärällä – tai käyttämällä apuna liitteessä A olevia taulukoita.

T-arvon käyttöä mittarina puoltaa Cardillon ja Smithin mielestä kuitenkin se, että sitä on käytetty lähes kaikessa GAS:ia koskevassa kirjallisuudessa.

2. Minkälainen mittari GAS on?

Cardillo ja Smith toteavat, että GAS on ensisijaisesti yksilöiden välisten (interindividual) erojen mittari. Se pyrkii myös löytämään ihmisten toimintaa koskevia lainalaisuuksia.

Fysikalistisesta näkökulmasta GAS:ia voidaan tarkastella pelkästään mittaamisen vällineenä. Cardillon ja Smithin mielestä siihen liittyy muitakin näkökulmia, eikä sen tarkasteleminen pelkästään mittarina ole välttämättä hyödyllisin tapa toimia. Esimerkkejä analysoimalla Cardillo ja Smith pyrkivät tuomaan esille menetelmän etuja ja rajoituksia.

35

Painon pudottamisen tukemiseen pyrkivän ohjelman analysoinnissa on etuna se, että tulokset voidaan määritellä täsmällisesti numeroilla ja GAS:n käyttöä yksilöiden väliseen vertailuun on helppo tutkia. Seuraavassa taulukossa on esitettynä neljän painoa pudottamaan pyrkivän henkilön tavoitteet.

GAS-arvot Todellinen painoHenkilö 1 Henkilö 2 Henkilö 3 Henkilö 4

– 2 170 170 130 ?– 1 165 167,5 120 ?0 160 165 115 ?

+ 1 155 162,5 112 ?+ 2 150 160 110 ?

Kahdella ensimmäisellä henkilöllä GAS-arvot edustavat painon putoamista tasamittaisin välein. Kolmannella henkilöllä tämä tilanne on toisenlainen. Lisäksi GAS:n 0-arvo on erisuuruinen kullakin henkilöllä. Painon putoamisen kilomäärät ovat myös kaikilla erilaiset. Neljännen henkilön arvot saattaisivat olla täysin erilaisia verrattuina edellisiin. Näin ollen, vaikka GAS-arvot edustavat saavutettua tulosta, niiden tosiasiallinen sisältö ei näytä olevan oleellista.

Toisena esimerkkinä Cardillo ja Smith esittävät matemaattisten taitojen ohjelman. Yhdelle henkilölle GAS-arvot - 2 – + 2 voivat olla yhteenlasku, vähennyslasku, molemmat, kertolasku ja jakolasku. Toisella arvoit voivat olla algebra, geometria, trigonometria, differentaalilaskenta ja integraalilaskenta.

Fysikalistisesti ajateltuna nämä esimerkit johtavat seuraaviin johtopäätöksiin. GAS-arvot ovat tyypillisesti yksilöllisiä epälineaarisia tavoitteiden jatkumon arvoja, jotka ovat erilaisia kullakin henkilöllä. GAS:n kokonaisarvot ovat keskiarvoja useista tällaisista arvoista. Pahimmillaan tavoitteiden jatkumo yhdelle tai useammalle skaalalle koostuu joukoista, joilla ei ole keskenään mitään yhteistä ja jotka on valittu varta vasten kullekin yksilölle niin, että tulosten keskinäinen vertailu on mahdotonta. Parhaimmassa tapauksessa voidaan olettaa, että skaalat ovat suurin piirtein tasavälein asetettuja ja keskenään vertailukelpoisia. Varsinkin, kun GAS-tavoiteet yleisesti asetetaan saman kontekstin sisällä, voidaan yleisellä tasolla olettaa, että skaalat keskimäärin edustavat likiarvoisesti tasaista asteikkoa. Tämä väite muuttuu vielä paikkansa pitävämmäksi, kun käyttöyhteys ja kohteet ovat keskenään yhdenmukaisia. Toisaalta, jos yhdenmukaisuus on korkea, on yhä todennäköisempää, että löydetään tyydyttävä ja GAS:ia helppokäyttöisempi mittari. Cardillo ja Smith toteavat kuitenkin, että fysikalistisesta näkökulmasta on vaikea vertailla GAS-jatkumon eri päissä esiintyviä arvoja keskenään, kun oletetaan, että skaalat ovat aidosti yksilöllisiä.

Fysikalistisesta näkökulmasta GAS-arvot ovat siis likiarvoja mutta sellaisina kuitenkin vertailukelpoisia myös yksilöiden välillä. Voidaan kuitenkin olettaa, että GAS ei esimerkiksi mittaa fysikaalista mielenterveyden muutosta vaan pikemminkin psykologista havaintoa muutoksista mielenterveyteen liittyvässä käyttäytymisessä. Fysikaalisella melutason mittaamisella desibeleinä on selkeä ero psykologisen äänekkyyden käsityksen mittaamiseen. Painonpudotuksen yhteydessä GAS-arvon tehtävänä ei olisi niinkään mitata painon muutoksia kuin havaittua kykyä muuttaa painoa, joka on aivan erilainen käsite. GAS:n näkökulmasta voidaan Cardillon ja Smithin mielestä todeta, että muutos voi olla erilainen kullakin yksilöllä, mutta tavoitteena on saada aikaan eri yksilöiden välisen vertailun mahdollistava asteikko. Psykofyysisestä näkökulmasta GAS tuottaa Cardillon ja Smithin mielestä pisteitä, jotka ovat yksilöiden välillä samalla tavalla vertailtavissa kuin millä tahansa standardoidulla psykologisella asteikolla. Käsitteellisesti tämä näkökulma, ei siis niinkään aiemmin kuvattu fysikalistinen, on yhtäpitävä Kiresukin ja Shermanin (1968) lähestymistavan

36

kanssa. Tämän väittämän kriittisin elementti on määritelmä mittaamisen kohteesta ”kykynä muutokseen” määrätyssä käyttäytymisessä, eikä niinkään kunkin asteikon tarkka sisältö. GAS:n käsittein voidaan todeta, että GAS-pisteitä voidaan pitää mittarina muutoksen suuruudesta suhteessa odotettavissa olevaan tilanteeseen.

Mittaamisen tasoon liittyvästä keskustelusta suurin osa keskittyy kiistaan siitä mitä tapahtuu, kun GAS-pisteiden analyysiin sovelletaan matemaattisia, erityisesti tilastotieteellisiä menetelmiä. Cardillo ja Smith valottavat kysymystä teoreettisesti monesta eri näkökulmasta. Yhteenvetona keskustelusta he toteavat käytännön työn kannalta, että mikäli GAS on mittari, jonka voidaan olettaa olevan yhtäjaksoinen ja sillä saatavat arvot asettuvat suurin piirtein normaalijakaumaan, voidaan tilastollisia menetelmiä legitiimisti käyttää tietojen analysointiin. Tässä suhteessa GAS kestää Carcillon ja Smitin mielestä vertailun mihin tahansa muuhun standardoituun psykologiseen mittariin.

3. Skaalojen painotus

Kiresukin ja Shermanin mukaan GAS antaa mahdollisuuden asettaa differentiaalisia numeerisia painoja seurantataulukon eri asteikoille. Tällaisten painojen käyttöä on kuitenkin kritisoitu ankarasti. Cardillo ja Smith toteavat, että huolellisesti laadituilla asteikoilla, joiden tavoitteet on aseteltu yhtä haastaviksi, numeeristen painojen asettaminen on mahdollista. Kuitenkin mm. ongelman ja käytettävissä olevien terapioiden vastaavuuden, kliinikon arvojen ja arvostusten, asiakkaan ja hänen verkostonsa vaikutusvallan ja ongelman keston huomioon ottaminen painotuksessa on tarpeen. GAS:n käyttöyhteyksissä on myös tyypillistä, että otos on usein melko pieni ja keskinäiset korrelaatiot vaihtelevat merkittävästi. Tästä syystä, varsinkin jos GAS:n käytön kannalta reliabiliteetin lisääminen olisi erityisen tärkeää, myös numeerinen painottaminen tulisi pitää mielessä. Cardillo ja Smith kuitenkin toteavat johtopäätöksenä numeeristen painojen käytöstä, että ne tekevät tavoitteiden asettelun mutkikkaaksi ja vaikeuttavat pisteiden summaamista. Näin ollen he ovat sillä kannalla, että GAS:n yhteydessä numeerista painotusta ei olisi syytä käyttää.

4. Sisäinen yhtenäisyys (consistency)

Kiresuk ja Sherman arvioivat aikanan, että GAS:n skaalojen keskimääräinen korrelaatio ( ρ ) on useimmissa yhteyksissä .30. Cardillon ja Smithin mukaan mm. Hennepin County Mental Health Centerissä toteutetussa GAS:n arviointiprojektissa tämä todennettiin empiirisesti. Toisessa tutkimuksessa, jossa mukana oli 695 henkilöä, todettiin luokkien sisäisen korrelaation olevan .27. Kolmannessa tutkimuksessa havaittiin, että henkilökunnan 31 potilaalle asettamien tavoitteiden korrelaatio oli .24, vanhempien 19 lapselle asettamien tavoitteiden korrelaatio .27 ja tutkijan 28 lapselle asettamien tavoitteiden korrelaatio .12 (Wallin 1974). Myös pienempiä ja suurempia korrelaatioita on tutkimuksissa havaittu. Cardillo ja Sherman huomauttavat, että käytännössä keskimääräisen korrelaation arvon vaikutus pisteiden keskihajontaan on vähäinen. Jos oletetaan, että Kiresukin ja Shermanin kaavan kaikki ehdot toteutuvat, mutta ρ = 0.00 tai 1.00 arvioidun .30 sijaan. Tällöin, painottamatta skaaloja ja sillä ehdolla, että seurantataulukoissa on kussakin täsmälleen

37

kolme skaalaa, saadaan käyttämällä liitteessä A olevaa taulukkoa tai Kiresukin ja Shermanin kaavaa tulokseksi T-arvoja, joiden keskihajonta on 11.21 ρ-arvolla 0.00 ja 8.77 arvolla 1.00. Käytännössä näin ollen ρ-arvojen vaihtelusta riippumatta useimmissa tapauksissa keskihajonta ei ole kaukana arvosta 10. Kriittinen kysymys tilastollisissa yhteyksissä on se, että onko saaduilla pisteillä normaalijakauma vai ei.

5. Jakaumaoletukset

Cardillo ja Sherman huomauttavat, että käytännössä GAS on pohjautunut määrättyihin jakaumaoletuksiin sekä tilastollisessa käytössä että summapisteiden laskemisessa.

Kiresuk ja Sherman olettivat kehittäessään GAS:n yhdistettyjä T-arvoja, että minkä tahansa hyvin rakennetun yksittäisen skaalan teoreettinen hajonta olisi keskiarvoltaan nolla ja keskihajonnaltaan noin 1. GAS:n yksilöllisen luonteen takia ei ole mahdollista testata tätä oletusta mutta koska jokaisen skaalan odotetaan tuottavan pisteitä, joiden normaalijakauman keskiarvo on nolla, voidaan eri kohteilta kerättyjä skaalapisteitä keskenään vertailemalla testata näiden oletusten pitävyyttä. Tämä poikkeaa oleellisesti tavanomaisesta testaamisesta, jossa kutakin yksikköä käytetään usealla asiakkaalla ja kullekin yksikölle syntyy useita toisistaan riippumattomia arvoja ja jakauma-arvot on helppo näyttää toteen. Cardillon ja Shermanin mielestä jakaumaoletukset ovat hyödyllisiä erityisesti, kun lasketaan standardoituja, yhteenlaskettuja GAS-pisteitä. Jakauman normaalius on kriittinen kysymys ainoastaan silloin, kun skaalapisteitä käsitellään tilastollisin menetelmin, jota tehdään käytännössä melko harvoin. Tilastollisia analyysejä tehdään tavallisesti ainoastaan GAS:n T-arvoista tai muista yhteenlasketuista pisteistä.

Yksittäiset skaalapisteeet eivät Cardillon ja Shermanin havaintojen mukaan ole normaalisti jakautuneita. Millä tahansa yhteenlasketulla GAS-pisteytyksellä tilanne on päinvastainen. Tällaiset pisteet voidaan skaalata uudelleen millä tahansa keskihajonnalla tai keskipoikkeamalla vaikeuksitta. Jakauman normaalius on kriittinen tekijä siksi, että summapisteitä käytetään toistuvasti ohjelmien keskinäiseen vertailuun ja tulosten arviointiin. Cardillon ja Shermanin kuvaamissa kahdessa laajassa tutkimuksessa GAS:n T-arvojen yhteenlasketut pisteet asettuivat lähelle normaalijakaumaa. Omassa tutkimuksessaan he huomasivat, että yksilöllisten pisteiden hajonnan ollessa yli yksi T-arvojen hajonta oli yli yksi, kuten oli oletettavaakin.

Cardillo ja Sherman korostavat, että tavoitteiden asettajat tapaavat keskimäärin laatia realistisia tavoitteita, joten skaalapisteiden keskiarvo asettuu lähelle nollaa ja T-arvojen keskiarvo lähelle viittäkymmentä. Vaikka keskihajonta ei olekaan heidän mielestään käytännössä kriittinen kysymys, se on Kiresukin ja Shermanin viisiportaista asteikkoa käytettäessä ja T-arvoja käytettäessä tyypillisesti hyvin lähellä kymmentä. Arvot näyttävät myös asettuvan normaalijakaumalle, joten GAS:iin voidaan soveltaa siihen perustuvia tilastollisia mentelmiä.

6. Räätälöity testaaminen

Viimeisten kahdenkymmenen vuoden aikana on etsitty entistä tehokkaampia keinoja yksilöllisten piilevien kykyjen ja ominaisuuksien mittaamiseen. Tämä on johtanut räätälöityjen testien kehittämiseen. Voidaan esimerkiksi pyrkiä testaamaan määrättyä kykyä ja halutaan arvioida yksittäisen asiakkaan tasoa kyseisessä

38

kyvyssä. Mikäli asiakkaan täytyy vastata kaikkiin testin kysymyksiin, menee tavallisesti paljon aikaa kysymyksiin, jotka ovat joko liian helppoja tai liian vaikeita. Tehokkaampaa olisi antaa asiakkaan vastata niihin kysymyksiin, jotka ovat lähellä todellista kykytasoa. Tällöin testitulos ei enää perustuisi oikeiden vastausten määrään – pisteet pitäisi määritellä tietämällä mihin kysymyksiin vastataan ja näiden vastausten pisteisiin, jolloin kukin kysymys pitäisi kalibroida kykytason kanssa.

Tähän tarkoitukseen on kehitetty uudenlainen mittausväline IRT (Item Response Theory), johon sisältyy kaksi keskeistä tehtävää: kysymysten kalibrointi kykytason kanssa ja kohdehenkilön kykytason määrittely näistä kalibroiduista kysymyksistä käsin. IRT:n taustaoletukset ja menetelmät ovat Cardillon ja Shermanin mielestä hämmästyttävän samankaltaisia kuin GAS:lla, jonka tavoitteidenasettelu muistuttaa räätälöidyn testaamisen kysymysten kalibrointia. Tämän samankaltaisuuden takia GAS saattaa jakaa IRT:n keskeisen edun, koska skaalapisteisiin ei kohdistu lattia- ja kattoefektejä, joita ilmenee usein tavallisissa mielenterveystyössä käytetyissä mittareissa. Tämä on ongelmallisia muutoksen mittaamisessa. Yksi tavallinen vaikutus lattia- ja kattoefektissä on jakauman vinous, joka mutkistaa tietojen tilastollista analysointia. Mikäli tämä kyetään välttämään, kuten IRT:ssä ja GAS:ssa, on ryhmien muutosten keskiarvopisteiden analysointi huomattavasti helpompaa. Helpoin tapa katto- ja lattiaefektin välttämiseksi on siis käyttää asteikkoja, joiden keskiarvopisteet asettuvat asteikon keskipistettä tai lähelle sitä.

IRT eroaa GAS:ista siinä, että se mittaa jonkin piirteen tai kyvyn määrää, kun GAS mittaa havaittua muutoksen määrää jossain käyttäytymisessä. IRT vertailee yksilöitä keskenään, ja GAS keskittyy yksilötason muutoksen mittaamiseen. Kummassakin menetelmässä kysymykset tai skaalat ovat erilaisia kullakin yksilöllä ja ne valitaan sen perusteella, mitä hänestä tiedetään. Molemmat tuottavat silti myös yksilöiden välillä vertailtavissa olevia arvoja. Cardillo ja Sherman toteavat, että mikäli IRT:stä pystyttäisiin kehittämään sovellus mielenterveystyön vaikuttavuuden arviointiin, GAS:ia ei kenties tarvittaisikaan. Joka tapauksessa vertailu IRT:n ja GAS:n käytöstä muutoksen mittarina olisi heidän mielestään kiinnostavaa.

10. GAS-pisteiden reliabiliteetti ss. 213 – 241

Joseph E. Cardillo ja Aaron Smith

Aiemmissa kappaleissa (9 ja 11) on esitetty perusteita ja empiiristä tietoa siitä, että GAS on pätevä muutoksen mittari. Tällaisen mittarin voi olettaa tuottavan erilaisia arvoja kahden eri mittauspisteen välillä: jos esimerkiksi mitataan GAS-arvoja kahden viikon intensiivisen psykiatrisen hoitojakson ensimmäisellä ja toisella viikolla, pitäisi pisteiden useimmilla potilailla olla erilaiset eri aikoina. Avohoidossa tuloksia saatetaan arvioida kuuden kuukauden hoitojakson päätteeksi, jolloin muutosta arvioivien mittareiden voisi olettaa olevan vähemmän arkoja heilahteluille muutaman päivän aikana, ja viikon välein saaduissa arvoissa ilmenevät heilahtelut olisivat merkki mittausvirheestä pikemmin kuin potilaan tilanteesta. Cardillon ja

39

Shermanin harmiksi useimmat GAS:n reliabiliteettiin liittyvät tutkimukset jättävät huomiotta sen mitä pisteiden olisi tarkoitus mitata. Tällöin mittausvirheiden ottaminen huomioon on ollut sekavaa ja epäjohdonmukaista. Cardillo ja Sherman jättävät tietoisesti käsittelemättä reliabiliteettikysymysten yhteydessä tavoitteiden erilaisuuteen liittyvät asiat. Heidän mielestään reliabiliteettikeskustelun on liityttävä summapisteisiin, koska useimmissa tapauksissa kullekin asiakkaalle laaditaan useampia kuin yksi skaala. Lisäksi voidaan todeta, että hoitoon tulevalla asiakkaalla on useimmiten useita ongelmia, joista terapeutti voi rakentaa tavoitteita usealla tavalla. Esimerkiksi yleissivistävät perusopinnot keskeyttäneelle potilaalle yksi terapeutti voisi asettaa tavoitteeksi kesken jääneiden opintojen päättämisen ja toinen työllistymisen. Sisällöllisesti nämä tavoitteet ovat erilaisia, ja sikäli reliabiliteetin kannalta pulmallisia. Molemmat tavoitteet lähtevät kuitenkin samalta pohjalta, eikä tällöin identtinen tavoitteiden asettaminen ole välttämätöntä reliabiliteetin kannalta. (Smith 1981: Goal Attainement Scaling…, s. 441).

Toinen kysymys reliabiliteettiin liittyen on skaalojen asettaminen. Yksi GAS:n peruskriteereistä on viisiportaisen, Kiresukin ja Shermanin (1968) määrittelemän asteikon käyttö, jota reliabiliteettinäkökohdatkin puoltavat. Useimmissa yhteyksissä on havaittu, että tavoitteiden asettelijoiden on äärimmäisen vaikeaa kehittää järkeviä asteikkoja, joissa olisi seitsemän tai useampia tasoja, ja viisi tasoa on käytännössä useimmiten enin mahdollinen määrä. Näin ollen kysymys tiivistyy valintaan kolmi- ja viisiportaisen asteikon välillä. Cardillo ja Smith toteavat, että viisiportainen asteikko tuottaa kolmella asteikolla 13 eri arvoa. Kolmiportaisella asteikolla samaan määrään pääsemiseksi tarvittaisiin kaksi kertaa enemmän skaaloja, ja GAS:n käytön yhteydessä on osoittautunut, että tavoitteiden asettelijoiden on hyvin vaikeaa tunnistaa viittä tai kuutta skaalattavaa tavoitetta kullekin asiakkaalle. Lisäksi heidän kokemuksensa mukaan useimmilla asiakkailla on kaksi tai kolme pääongelmaa, joihin hoidolla on mahdollista vaikuttaa, ja tavoitteiden asettelijoilta vaaditaan useimmiten yhden skaalan rakentamista kullekin ongelma-alueelle. Useamman skaalan käyttö lisäisi myös painottamiseen liittyviä ongelmia, jonka lisäksi riskinä olisi se, että skaaloja rakennetaan helppouden eikä niinkään hoitoon liittyvien tarpeiden pohjalta. Näistä syistä Cardillo ja Sherman suosittelevat voimakkaasti käyttämään viisiportaista asteikkoa, jossa on vähintään kolme skaalaa kutakin asiakasta kohti.

Cardillo ja Smith valottavat reliabiliteetin arviointia myös teoreettisesti. Heidän mielestään CT (Classical Test Theory) ei ole riittävä reliabiliteetin mittari vaan tarvitaan tätä laajempaa GT:tä (Generalizability Theory). Jälkimmäinen tunnistaa myös sen, että saatujen pisteiden varianssi voi riippua useasta lähteestä. Kokonaisvaltaisessa reliabiliteetin arvioinnissa olisi hyvä ottaa huomioon myös se, että pisteitä käytetään päätöksenteon tai johtopäätösten pohjana.

GT:n ydin on universumiarvo (universe score). Se tarkoittaa, että mille tahansa mittarille voidaan kuvitella monta erilaista universumia, jossa yleistyksiä halutaan tehdä. Yleistyksen täsmällisyys, reliabiliteetti, vaihtelee eri universumeissa. Universumi, joka koostuu arvoista, jotka saadaan suurelta määrältä samalla tavoin koulutettuja pisteyttäjiä, ei ole sama kuin universumi, johon kuuluvat kaikki mahdolliset arvot. Mikä tahansa universumi määritellään niiden ehtojen kautta, joilla hyväksyttävä arvo voidaan saavuttaa. Kukin ehto (pisteyttäjät, testien muodot, tilanteet, ympäristö jne.) on nimeltään viiste (facet). Kukin universumi voi koostua useista viisteistä. Useimmissa yhteyksissä henkilöt ovat mittaamisen kohteina ja heidän välisiään eroja käsitellään todellisena varianssina kun muut viisteet ovat virheitä. GT antaa mahdollisuuden siihen, että joku toinenkin viiste voidaan käsittää mittaamisen kohteeksi, jolloin henkilöiden viistettä käsitellään virheenä. Tämä GT:n piirre on nimeltään symmetriaperiaate. Esimerkkinä viisteistä Cardillo ja Sherman ottavat avohoidon mielenterveyspotilaan, jonka tavoitteet asettaa vastaanoton työntekijä ja joiden toteutumista seuraa puolueeton arvioija haastattelussa kuukauden kuluttua hoidon päättymisestä.

40

Tässä tilanteessa voidaan määritellä ainakin kolme ehtoa: erilaiset vastaanoton työntekijät, arviointihetken erot ja eri seurantahaastattelun tekijät. Tutkijan täytyy ensimmäiseksi määritellä yleistämisen universumi. Jos havainnoitavan arvon täytyy olla yleistettävissä kaikilla mahdollisilla vastaanoton työntekijöillä, kaikilla mahdollisilla seurantahetkillä kuukauden jakson aikana ja kaikilla mahdollisilla arvioijilla, täytyy kaikkien kolmen viisteen olla määritellyn universumin osana. Minkä tahansa arvion yleistettävyydestä täytyisi ottaa huomioon näihin viisteisiin liittyvä variaatio.

Jos kaikki potilaat arvioidaan välittömästi viimeisen terapiaistunnon jälkeen, ei seuranta-ajankohdan variaatiolla ole merkitystä. Lisäksi voidaan sopia, että kunkin seurantahaastattelun tekee yksi tai kaksi koulutettua arvioijaa, jolloin jälkimmäisessä tapauksessa hypoteettisen joukon arvioijia korvaa variaatio kahden arvioijan välillä. Näillä ehdoilla ei enää ole kolmea sattumanvaraista viistettä, jotka määrittävät yleistettävyyden universumia. Sen sijaan on yksi satunnainen viiste (vastaanoton työntekijät), yksi määrätty viiste (arvioijat) ja yksi viiste, jolla ei ole merkitystä (seurantahetki), koska se on rajoitettu yhteen arvoon. Tällainen asetelma tuottavaa todennäköisesti pisteitä, joilla on pienempi virhemahdollisuus kuin alkuperäisessä esimerkissä kolmine sattumanvaraisine viisteineen.

Reliabiliteetin kannalta on Cardillon ja Shermanin mielestä oleellista tietää ensin mitä halutaan mitata ennen kuin voidaan määritellä miten mitataan. Mittaamisen ajankohdan määritteleminen on reliabiliteetin kannalta merkityksellistä, koska GAS:n luonteeseen muutoksen mittarina kuuluu myös se, että pisteiden arvon voi odottaa olevan erilainen eri ajankohtina. Reliabiliteettiin vaikuttaa myös se, kuka tavoitteet asettaa. Tavoitteiden tulisi heijastaa asiakkaan ongelmia parhaalla mahdollisella tavalla, jotta ne muodostaisivat pohjan suunnitellulle hoidolle – näin ollen hoidon toteuttaja on paras mahdollinen tavoitteiden asettaja. Se, että eri tavoitteiden asettelijoiden asettamat tavoitteet samankaltaisessa problematiikassa voivat vaihdella, ei ole Cardillon ja Shermanin mielestä reliabiliteetin vaan pikemminkin validiteetin ongelma.

11. Näkökulmia validiteettiin ss. 243 - 272

Aaron Smith ja Joseph E. Cardillo

Tässä luvussa Smith ja Cardillo luokittelevat kaikki tiedossa olevat GAS:n validiteettiin liittyvät tutkimukset yhteen tai useampaan kolmesta luokasta: sisällöllinen validiteetti, kriteereihin liittyvä validiteetti ja käsitteellinen (construct) validiteetti. Kaikessa validiteettiin liittyvässä keskustelussa oletetaan, että vertaillaan ja arvioidaan yksilöiden välillä vertailtavissa olevia arvoja. GAS:n tapauksessa oletetaan, että kyseessä on arvo, jolla mitataan muutoksen määrää suhteessa siihen mitä odotettiin. Yleensä validiteettia arvioidaan korrelaatioiden suhteilla mutta GAS:n kohdalla myös keskiarvo antaa jonkin verran tietoa siitä. Keskiarvo voi olla tärkeä tieto, mikäli a) sisällön validiteetti on kohdallaan, b) yksilöiden välinen pisteiden vertailu on merkityksellistä, c) on saavutettu likimääräiset arvojen välit ja d) GAS:n määritellyt laatukriteerit täyttyvät. Tällöin keskiarvo kertoo suoraan muutoksen määrän. Keskiarvo +0.85 voidaan tulkita yhden ryhmän sisällä suoraan muutoksen määräksi ja keskiarvo -1.3 herättäisi kysymyksiä hoidon vaikuttavuudesta. Itse asiassa GAS:n kohdalla voidaan päätyä hyvin alhaiseen korrelaatioon, mutta tämä ei välttämättä ole merkki siitä, että tulos ei olisi validi. Esimerkiksi painonpudottamiseen tähtäävässä ohjelmassa voidaan tapahtunutta muutosta arvioida seuraavasti:

41

Henkilö GAS Todellinen painon muutos

1 0 -10

2 +2 -10

3 -1 -10

Keskiarvo +.33 -10

Näillä arvoilla keskimääräinen muutos on positiivinen, eli enemmän kuin odotettiin, mikä on suoraan tulkittavissa oleva tulos. GAS-arvoilla samansuuruinen painon putoaminen saa kullakin henkilöllä eri pisteet. Todellisella painon putoamisella ei ole variaatiota, joten korrelaatio GAS:n ja todellisen painon muutoksen välillä on nolla. Tämä ei kuitenkaan ole Cardillon ja Shermanin mukaan todiste GAS:n validiteettia vastaan.

1. Sisällön validiteetti

Tämä lähestymistapa arvioi määrää, jolla mittausvälineen tuottamat yksilölliset arvot todellisuudessa heijastavat sen toiminnan sisältöä, jota mittarin on tarkoitus mitata. Näin ollen täytyy pystyä määrittelemään tai kuvaamaan tarkasti sen toiminnan sisältö, jota testin väitetään edustavan. GAS:n tapauksessa sen validiteettia mielenterveystyössä on lähestytty arvioimalla kuinka valitut tavoitteet heijastavat asiakkaan mielenterveyden perusongelmia.

Sherman (1974, Developement of the Goal Attainement Score) oli sitä mieltä, että GAS-pisteiden arviointiin ei ole mahdollista löytää rajattuja kriteereitä, joten hän suositteli käytettäväksi juuri sisällön validiteetin arviointia. Tämän näkemyksen pohjalla on oletus siitä, että kukin GAS-pisteytys on satunnainen otos universumista, jossa ovat mukana kaikki mahdolliset tavoitteiden asettelija – seurantahaastatteluntekijä –parit. Hennepin County Mental Health Centerissä tehty tutkimus (Garwick&Lampman (1972), jossa ensimmäisistä 332 loppuun viedystä GAS-arvioinnista otettiin 113 kappaleen satunnaisotos, havaittiin että skaalatuissa tavoitteissa todellakin oli tavoitteita, jotka olivat hyvin yhdenmukaisia mielenterveyskeskuksen asiakkailla yleensä olevien ongelmien kanssa. Smith ja Cardillo kuvaavat muitakin tutkimuksia, joissa keskityttiin edellistä enemmän selvittämään kuinka paljon asiakkaille asetetut tavoitteet olivat sisällöltään sopivia juuri heille. Näissä tutkimuksissa 78 – 97 % tavoitteista havaittiin relevanteiksi. Tutkimuksissa oli eroavaisuuksia mm. tavoitteiden asettelussa (terapeutti/vastaanoton työntekijä/asiakas itse). Lisäksi eroja oli tiedoissa, joihin tavoitteiden relevanssin lukemat perustuivat. Näin ollen tulosten yleistettävyys on rajallinen, ja vaikka tulokset ovatkin vaikuttavia, on em. rajoitukset pidettävä mielessä niitä arvioitaessa.

Reno VA Medical Centerissä tehtyyn tutkimukseen sisältyi arvio tavoitteiden kliinisestä relevanssista ja realistisuudesta. Tässä tutkimuksessa havaittiin, että ainoastaan 12.1 % kaikkiaan 165 arvioidusta skaalasta oli vain vähän tai ei yhtään relevantti. Näiden tietojen perusteella Smith ja Cardillo ovat sitä mieltä, että mielenterveystyön ammattilaiset pystyvät yhdessä asiakkaiden kanssa laatimaan GAS-formaatilla tavoitteita, joita voidaan pitää realistisina. Sisällön validiteetilla on kuitenkin omat rajansa.

42

Sisällön validiteetti liittyy ensisijaisesti siihen kuinka hyvin mittari edustaa toimintaa, jota arvioidaan ja tarjoaa näin ollen melko vähän tietoa GAS-arvojen validiteetista. Juuri GAS-arvon pitäisi olla keskiössä, kun arvioidaan menetelmän validiteettia, koska se mittaa saavutettua muutosta. Mikäli tutkija haluaa esimerkiksi tutkia älykkyystestin validiteettia, olisi arvioitava yhteenlaskettuja pisteitä (ÄO), eikä yksittäisten arvojen sisältöä. Jos yhteispisteet eivät ole valideja, ei voida siitä huolimatta, että yksittäiset arvot olisivat, olla varmoja siitä tuottaako testi validin arvion älykkyydestä. Samalla tavalla, mikäli GAS-arvoa ei voida pitää validina, eivät suurimmatkaan kehut siitä, että tavoitteiden sisältö vastaa toimintaa ole merkityksellisiä. Smithin ja Cardillon mielestä GAS:n validiteetti lepää vahvasti GAS-arvojen pohjalla.

2. Validiteettien vertailu (criterion-related validity)

Tässä yhteydessä Smith ja Cardillo päätyvät arvioimaan GAS-pisteiden validiteettia vertaamalla sitä pisteisiin tai arvoihin, joita muut samaan tavoitteeseen pyrkivät mittarit yrittävät arvioida. Tätä kutsutaan validiteettien vertailuksi (criterion-related validity). Tällaista vertailua on yleensä pidetty välttämättömänä minkä tahansa testin validiteetin arvioinnissa. Tällaisessa validiteetin arvioinnissa on GAS:n kohdalla otettava huomioon se, mitä sen ajatellaan mittaavan. Ensimmäisissä tutkimuksissa GAS:n arvioitiin mittaavan hoidon päättymisen jälkeistä tilannetta, mutta myöhemmät tutkimukset näyttävät pitävän sitä enemmän muutoksen mittarina. Toinen merkille pantava seikka on se kuinka vertailtava mittari valitaan. Mikäli valittu vertailukohta on epätarkka tai huono, voi matala korrelaatio johtua myös siitä, että testattava mittari on yksinkertaisesti parempi kuin se, johon vertailu kohdistuu. Lisäksi, vaikka vertailtava mittari valittaisiinkin oikein mutta sen reliabiliteetti on alhainen, syntyy kattoefekti: korrelaatio vertailtavan ja kriteerimittarin välillä voi olla enintään neliöjuuri kummankin reliabiliteetin tulosta. Näin ollen, jos vertailumittarin reliabiliteetti on alhainen, vaikkapa .60 ja GAS:n reliabiliteetti .80, voi validiteetin kerroin olla korkeintaan r = .69 riippumatta siitä kuinka validin mittauksen GAS tuottaa.

Varhaisimmissa GAS:ia koskevissa validiteettien vertailuissa korrelaatiot valitun vertailukohdan ja GAS:n välillä olivat tilastollisesti vähän merkitseviä. Smithin ja Cardillon mielestä nämä tulokset liittyivät juuri edellä esitettyihin validiteetin vertailun pulmiin. Esimerkiksi Garwickin (1974) tutkimuksessa GAS määriteltiin odotusten saavuttamisen asteikoksi. Vertailu Brief Psychiatric Rating Scaleen, jota ei välttämättä voida pitää saman asian mittarina, oletettavasti vaikutti tuloksiin. Vertailtaessa GAS-pisteitä 12-portaiseen asiakastyytyväisyyden mittariin saatiin kuitenkin tilastollisesti merkitsevä korrelaatio r = .21 p < .01 ja seuranneessa tutkimuksessa pienemmällä asiakasmäärällä r = .23 p < .01. Tämä on Smithin ja Cardillon mielestä enemmän rakennevaliditeetin merkki, koska asiakastyytyväisyys ei näytä olevan GAS:n kohdalla pätevä vertailuperuste.

Maugerin, Stohlbergin, Audetten ja Simoninin (1974) tutkimuksessa vertailukohdaksi otettiin MMPI. Tässä 28 asiakasta oli tehnyt MMPI:n sekä ennen hoitoa että sen päätyttyä. Tutkijat päättelivät, että koska MMPI mittaa sopeutumisen tasoa muutoksen siinä pitäisi korreloida GAS:n kanssa, koska molemmat käsittelevät psykoterapian tulosta. Tuloksena saatiin suhteellisen alhainen korrelaatio r = .285 p < .07, eli ei odotettua yhtäläisyyttä GAS:n kanssa. Smithin ja Cardillon mielestä ko. tutkimuksessa oli metodologisia ongelmia, jotka selittävät osaltaan tulosta.

Metodologisesti edellisiä huolellisemmin tehtyjä tutkimuksia on myös Cardillon ja Smithin mukaan myös tehty. Jacobsin ja Cyrrenbaumin (1977) tutkimuksessa selvitettiin laajasti GAS:n validiteettia ja

43

reliabiliteettia psykiatrisessa kriisiyksikössä. Tässä yhteydessä kahden tavoitteidenasettelijan 118 potilaalle laatimista seurantataulukoista laskettiin GAS-arvot erikseen. Korrelaatio näiden kahden tavoitteiden asettelijan pisteiden välillä oli r = .52 p < .001. Jatkoanalyysi perustui näiden kahden GAS-pisteytyksen keskiarvoihin, joita vertailtiin potilaiden itsearviointiin, hoitavan tahon arvioon tuloksista, siihen oliko hoidon päättämisestä yhteinen sopimus ja hoidon kestoon. Havaintona oli se, että GAS korreloi eniten kaikkien muiden mittareiden kanssa ja oli ainoa, joka korreloi merkittävästi näiden kaikkien kanssa. Toinen laaja tutkimus oli Santa-Barbara ym. (1977) perheterapian tuloksista tekemä tutkimus, jossa GAS:n havaittiin korreloivan merkitsevästi lähes kaikkien lopputulosta arvioivien mittareiden kanssa, joita olivat hoidon päättäminen (hyvä = yhteinen päätös; huono = yksipuolinen päätös), muutos (terapeutin arvioima muutos hoidon aikana)ja ennuste (terapeutin arvio). Ainoastaan hoidon päättämisen korrelaatio GAS:n kanssa ei ollut merkitsevä.

Simonsin, Mortonin, Waden ja McSharryn (1978) tutkimuksessa koottiin 10 %:n satunnaisotos 1700 hoidon päättäneestä potilaasta viiden ja puolen vuoden ajalta. Tässä tutkimuksessa Smithin ja Cardillon mielestä kiinnostavin havainto oli, että GAS-arvojen ja terapeuttien tekemän arvion kokonaisedistymisestä välinen korrelaatio oli r = .52 p < .001, joka tuki GAS:n validiteettia. Yhteenvetona tutkimuksista Smith ja Cardillo toteavat, että GAS-arvot korreloivat johdonmukaisesti ja merkitsevästi muiden psykiatrisen hoidon tuloksia arvioivien mittareiden kanssa.

3. Käsitteellinen validiteetti (construct validity)

Silloin, kun pisteiden tai testiarvojen sanotaan esittävän määrättyä psykologista käsitettä, eli hypoteettista piirrettä, taipumista tai käyttäytymistä, jota ei voida suoraan mitata, käsitteellinen validiteetti arvioi kuinka hyvin testin pisteet edustavat tätä käsitettä. Käsitteellistä validiteettia arvioitaessa on laadittava käsitteestä hypoteeseja ja tämän jälkeen testattava niitä empiirisesti. Näin ollen käsitteellinen validiteetti sisältää verkon testattavia hypoteeseja ja teoreettisesti johdettuja suhteita, joista ainoakaan ei yksin osoita todeksi validiteettia. Tyypillisesti käsitettä todennetaan lisää, parannellaan tai muokataan sitä mukaa kun uutta tietoa syntyy. Tuloksena on parempi ymmärrys testipisteiden merkityksestä ja yhtenäisempi käsitys sen validiteetista.

GAS:n validiteettia koskevissa tutkimuksissa on ollut hankaluutena määritellä mitä GAS tosiasiassa mittaa. Smith ja Cardillo ehdottavat, että käsite, jota GAS mittaa on keskimääräinen muutos, joka on tapahtunut asiakkaassa hoidon seurauksena. Se ei siis ole hoidon jälkeisen tilanteen tai toiminnan tason mittari. Asiakashan voi saavuttaa korkean GAS-pistemäärän mutta olla edelleen pahasti sairas verrattuna väestöön keskimäärin. Tämä ei kuitenkaan tarkoita, etteikö GAS:illa olisi yhteyttä hoidon jälkeisiin mittareihin. Smith ja Cardillo olettavat, että GAS-pisteiden ja hoitoa edeltävän tilanteen välillä on vähän tai ei ollenkaan korrelaatiota. Hoidon jälkeinen tilanne määrittyy hoitoa edeltävästä tilanteesta. Koska GAS-pisteillä pitäisi olla mitätön korrelaatio hoitoa edeltävän tilanteen kanssa ja positiivinen korrelaatio muutoksen kanssa pitäisi olla odotettavissa positiivinen, joskin kohtalainen korrelaatio GAS-pisteiden ja hoidon jälkeisen tilanteen kanssa. Toteutetuissa tutkimuksissa onkin löydetty vahvaa tukea siitä, että GAS toimii hoidon tuloksia arvioivana mittarina.

Kiresukin kollegoineen toteuttamassa tutkimuksessa yritettiin erottaa toisistaan psykoterapian, ryhmäterapian, päihdehoidon ja avohoidon vaikutuksia. Tuloksena havaittiin, että kaikissa neljässä ryhmässä tapahtui parannusta mutta GAS:n tulokset eivät vaihdelleet ryhmien välillä – eivät myöskään muilla käytetyillä mittareilla. Tästä voidaan Smithin ja Cardillon mielestä päätellä, että joko ainutkaan

44

mittari ei mittaa ryhmien välisiä eroja, tai – todennäköisemmin – kaikki hoidot tuottivat samantasoisia tuloksia, jolloin GAS-pisteet muiden mittareiden tapaan heijastivat hoidon tuloksia. Samantapaisia tuloksia on saatu muissakin tutkimuksissa, ja havainnot tukevat sitä, että GAS on validi muutoksen mittari.

4. Johtopäätökset

Smithin ja Cardillon tiukoilla kriteereillä mukaan sisällyttämien tutkimusten perusteella he päätyvät toteamaan, että terapeutit pystyvät asettamaan tavoitteita, jotka ovat relevantteja mielenterveyspotilaiden tilanteessa. Löydökset tukevat myös sitä, että tavoitteiden ei tarvitse olla riippumattomien tavoitteiden asettelijoiden asettamia. GAS mittaa myös samoja muuttujia, joita muillakin mittareilla on testattu. Se ei kuitenkaan, kuten useimmat muutkaan mittarit, anna tuloksia hoidon vaikuttavuudesta yleensä. Sen ansio on hoidon aikaansaaman muutoksen mittaamisessa. Näin ollen, mikäli halutaan arvioida muutosta tai vaikuttavuutta eikä niinkään potilaan tilan tosiasiallista parantumista, GAS:ia voidaan suositella tämän muutoksen herkkänä mittarina. Johtopäätöksenä tästä on myös se, että GAS:ia on täydennettävä, mikäli halutaan sen mittaavan myös hoidon jälkeistä tilannetta. GAS kuitenkin tuottaa paremman arvion hoidon vaikuttavuudesta kuin mikään Smithin ja Cardillon tiedossa oleva mittari.

Liite A

Summapisteiden muuntoavain

Joseph E. Cardillo ss. 273 – 278

Tämä muuntoavain on James Baxterin (1973) kehittämä. Sen käytön ohje perustuu käyttäjien kokemuksiin. Kuhunkin taulukkoon on sisällytetty sekä keksimääräiset summapisteet että T-arvot ja ne mahdollistavat GAS:n summapisteiden laskemisen samalla tavalla painotetuilla (tai painottamattomilla) asteikoilla. Kaikki

45

T-arvot on laskettu käyttämällä arvo 0.3 arviona skaalojen keskimääräisestä korrelaatiosta. Taulukoiden käytön edellytyksenä on, että tavoitteet on skaalattu käyttämällä -2 – +2 –asteikkoa.

TAULUKOIDEN KÄYTTÖ

1. Määritellään seurantataulukon skaalojen määrä. Tässä muuntoavaimessa on summapisteet 1 – 8 skaalaa sisältäville seurantataulukoille, joista referaatissa on mukana 1 - 4.

2. Valitaan taulukko, joka vastaa skaalojen määrää. Esimerkissä A.1., jossa on kolme skaalaa, käytetään taulukkoa A.3. Jos taulukossa olisi neljä skaalaa, käytettäisiin taulukkoa A.4.

3. Määritellään yksittäisten skaalapisteiden summa. 4. Etsitään taulukosta skaalapisteiden summa joka vastaa vaiheessa 3. laskettua arvoa. Taulukossa

rivillä, jolla on vastaava arvo, on myös keskimääräinen skaala-arvo (toinen sarake) ja T-arvo (kolmas sarake)

Esimerkissä A.1. saatu summa +1 vastaa keskiarvoa (Average Scale Score) +0.33 ja T-arvoa 54.56 (ks. taulukko A.3).

GOAL ATTAINEMENT FOLLOW-UP GUIDE

Level of Attainement

Skaala 1Urasuunnittelu

Skaala 2 Vihan hallinta

Skaala 3Itsetunto

Paljon vähemmän -2 kuin odotettiin

Ei ole valinnut yhtään urasuunnitelmaa.

Vähemmän kuin 25% ajasta.

Enimmäkseen kielteisiä piirteitä (tuntee itsensä arvottomaksi).

Hieman vähemmän -1 kuin odotettiin

Yksi tai useampi urasuunnitelma valittuna mutta ei suunnitelmaa.

Vähintään 25% ajasta. Enemmän kielteisiä kuin myönteisiä piirteitä.

46

Tavoite on toteutunut 0odotetulla tavalla

On valinnut yhden tai useampia urasuunnitelmia ja laatinut suunnitelman sen/niiden toteuttamiseksi.

On pystynyt hallitsemaan vihan tunteita vähintään 50% ajasta viimeisen kahden viikon aikana (oma arvio).

Tuntee, että kielteisiä ja myönteisiä piirteitä on saman verran.

Hieman enemmän +1 kuin odotettiin

On toteuttanut suunnitelmaa (esim. työhaastattelu).

Vähintään 65% ajasta.

Enemmän myönteisiä kuin kielteisiä piirteitä.

Paljon enemmän +2 kuin odotettiin

On saanut työtä haluamallaan alalla.

Vähintään 85% ajasta. Enimmäkseen myönteinen kuva itsestä.

HuomautuksetEsimerkki A.1.

TAULUKKO A.1.Muuntoavain seurantataulukolle, jossa on yksi skaala

Skaalapisteiden summa Skaalapisteiden keskiarvo T-arvo- 2 - 2.00 30.00- 1 - 1.00 40.000 0 50.00

+ 1 + 1.00 60.00+ 2 + 2.00 70.00

TAULUKKO A.2.Muuntoavain seurantataulukolle, jossa on kaksi skaalaa

Skaalapisteiden summa Skaalapisteiden keskiarvo T-arvo- 4 - 2.00 25.19- 3 - 1.50 31.39- 2 - 1.00 37.59- 1 - 0,50 43.790 0 50.00

+ 1 + 0.50 56.21+ 2 + 1.00 62.41

47

+ 3 + 1.50 68.61+ 4 + 2.00 74.81

TAULUKKO A.3.Muuntoavain seurantataulukolle, jossa on kolme skaalaa

Skaalapisteiden summa Skaalapisteiden keskiarvo T-arvo- 6 - 2.00 22.62- 5 - 1.67 27.18- 4 - 1.33 31.74- 3 - 1.00 36.31- 2 - 0.67 40.87- 1 - 0.33 45.440 0 50.00

+ 1 + 0.33 54.56+ 2 + 0.67 59.13+ 3 + 1.00 63.69+ 4 + 1.33 68.26+ 5 + 1.67 72.82+ 6 + 2.00 77.38

TAULUKKO A.4.Muuntoavain seurantataulukolle, jossa on neljä skaalaa

Skaalapisteiden summa Skaalapisteiden keskiarvo T-arvo- 8 - 2.00 20.98- 7 - 1.75 24.61- 6 - 1.50 28.24- 5 - 1.25 31.86- 4 - 1.00 35.49- 3 - 1.75 39.12- 2 - 0.50 42.75

48

- 1 - 0.25 46.370 0 50.00

+ 1 + 0.25 53.63+ 2 + 0.50 57.25+ 3 + 0.75 60.88+ 4 + 1.00 64.51+ 5 + 1.25 68.14+ 6 + 1.50 71.76+ 7 + 1.75 75.39+ 8 + 2.00 79.02

Liite B

Seurantataulukoiden pitäminen kuosissa

Robert E. Sherman

GAS:n tapauksessa voidaan käyttää ongelmien havaitsemisen, ohjelman pitämisen kuosissaan ja yksittäisten työntekijöiden toiminnan parantamisen tukena summapisteiden keskiarvoa ja hajontaa. Mikäli ohjelma tai yksittäisen työtekijän toiminta alkaa löystyä, on siitä hyvä saada varhainen varoitus. Kun GAS:ia käytetään selittämään hoidon tavoitteita ja odotettuja tuloksia asiakkaille, on tärkeää että a) skaalat asettuvat lähelle keskiarvoa eikä b) loppupisteiden hajonta ole liian suuri.

Ensimmäinen näistä ehdoista edellyttää, että on olemassa standardi hyväksyttävälle puolueellisuudelle määrätyn tavoitteiden saavuttamistaulukkojen määrän keskiarvossa. Mikäli skaalaus toimii kunnolla, pitäisi sarjan (T-arvojen) keskiarvon olla lähellä 50, kun sarjan koko on suuri. Toinen ehto tarkoittaa sitä, että on olemassa standardi keskihajonnalle: kunkin otoksen keskihajonnan pitäisi olla lähellä 10, kun otos on suuri.