031021P Tilastomatematiikka (5 op)
Jukka Kemppainen
Mathematics Division
Yleinen todennäköisyys
Kertausmateriaalissa esiteltiin koulusta tuttujatodennäköisyysmalleja. Tällä kurssilla todennäköisyys on(abstrakti) funktio P , joka on määritelty tapahtumasysteemissä Eja joka toteuttaa todennäköisyyden perusominaisuudet kutenesimerkiksi
P(A) = 1 − P(A) tai P(A ∪ B) = P(A) + P(B)− P(A ∩ B).
Tapahtumasysteemiltä vaaditaan riittävästi rakennetta, jottatodennäköisyys on hyvin määritelty. Esitetään seuraavassavenäläisen matemaatikon Andrei Kolmogorovin (1903-1987)esittämä todennäköisyyden matemaattinen malli. On ehkähämmästyttävää, että matemaattisen mallin määrittelyyn riittääkolme ehtoa.
Jukka Kemppainen Mathematics Division 2 / 32
Yleinen todennäköisyys
Tapahtumasysteemiltä vaaditaan σ-algebran rakenne.
Määr. 1
Tapahtumasysteemi E on σ-algebra, jos
1. ∅,S ∈ E
2. A ∈ E =⇒ A ∈ E
3. A,B ∈ E =⇒ A ∪ B ∈ E
4. A,B ∈ E =⇒ A ∩ B ∈ E
5. Ai ∈ E kaikilla i ∈ N ⇒⋃
∞
i=1Ai ∈ E .
Nyt voidaan esitellä Kolmogorovin todennäköisyyden aksioomat,jotka antavat todennäköisyyden matemaattisen mallin.
Jukka Kemppainen Mathematics Division 3 / 32
Todennäköisyyden aksioomat
Määr. 2
Todennäköisyysavaruus on kolmikko {S , E ,P}, missä S onepätyhjä joukko, E on σ-algebra ja kuvaus P : E → R toteuttaaehdot
1. 0 ≤ P(A) ≤ 1
2. P(S) = 1
3. Jos Ai ∈ E ja Ai ∩ Aj = ∅ aina, kun i 6= j ja i , j = 1, 2, . . .,niin
P( ∞⋃
i=1
Ai
)=
∞∑
i=1
P(Ai).
Ehtoja 1 − 3 sanotaan todennäköisyyslaskennan aksioomiksi jakuvausta P , joka toteuttaa ehdot 1 − 3, sanotaantodennäköisyydeksi.
Jukka Kemppainen Mathematics Division 4 / 32
Todennäköisyydestä
Huomautus 1
Todennäköisyys voi siis olla periaatteessa mikä tahansa funktio,kunhan se toteuttaa Määritelmän 2 ehdot. Todennäköisyys riippuumm. otosavaruuden S valinnasta.
Huomautus 2
Todennäköisyys voi olla subjektiivinen eli riippua siitä, kuka senmäärittelee. Eri henkilöillä voi olla erilainen näkemys samastasatunnaiskokeesta.Tapahtuman todennäköisyys voi olla vaikkapa 90%, mutta joskysytään Stubbilta, saman tapahtuman tn. voi olla 10%.Myös eri rahapelitoimistot voivat antaa erilaisia voittokertoimia(so. erilaisia voittotodennäköisyyksiä) samoille kohteille.
Jukka Kemppainen Mathematics Division 5 / 32
Todennäköisyyden perusominaisuudet
Lause 1
Todennäköisyydelle on voimassa:
(i) P(∅) = 0;
(ii) P(A) = 1 − P(A);
(iii) Jos tapahtumat {A1,A2, . . . ,An} ovat erillisiä, ts.Ai ∩ Aj = ∅, kun i 6= j , niin
P(A1 ∪ A2 ∪ · · · ∪ An) = P(A1) + · · · + P(An);
(iv) P(A) ≤ P(B) aina, kun A ⊂ B;
(v) P(A ∩ B) = P(A)− P(A ∩ B);
(vi) P(A ∪ B) = P(A) + P(B)− P(A ∩ B).
Jukka Kemppainen Mathematics Division 6 / 32
Esimerkkejä
Todennäköisyyksien laskemisessa voidaan (ja on suotavaa) käyttääLauseen 1 tuloksia. Lisäksi joukko-opista tutut De Morganin
kaavat
A ∪ B = A ∩ B
A ∩ B = A ∪ B
voivat olla hyödyksi.
Esim. 1
Olkoon P(A) = 3
5, P(B) = 1
2ja P(A ∩ B) = 1
5. Laske
todennäköisyydet
P(A ∪ B), P(A), P(B), P(A ∪ B), P(A ∩ B) ja P(A ∩ B).
Jukka Kemppainen Mathematics Division 7 / 32
Ehdollinen todennäköisyys
Todennäköisyys riippuu vähintäänkin otosavaruuden valinnasta.Esimerkiksi eri sairauksen esiintyvyys voi poiketa hyvinkin paljoneri alueilla. Jos vaikkapa analysoidaan tuberkuloositartuntaa, oneri asia tutkitaanko sitä Suomessa tai esimerkiksi Venäjällä.Käytännöllisesti katsoen kaikki todennäköisyydet ovat ehdollisia.Ehdollisen todennäköisyyden käsite on eräs todennäköisyysteoriantärkeimmistä käsitteistä. Esitetään seuraavaksi ehdollisentodennäköisyyden määritelmä.
Jukka Kemppainen Mathematics Division 8 / 32
Ehdollinen todennäköisyys
Määr. 3
Olkoon S otosavaruus, A,B ⊂ S tapahtumia ja P todennäköisyys.Tapahtuman A ehdollinen todennäköisyys ehdolla B on
P(A|B) =P(A ∩ B)
P(B),
jos P(B) > 0.
Ehdollista todennäköisyyttä ei ole määritelty, kun P(B) = 0.Tilastollisessa päättelyssä ehdollinen tn. P(A|B) on tapahtuman Atn:n P(A) päivitys, kun on havaittu informaatio B . Tapahtuma Bvoidaan ottaa uudeksi otosavaruudeksi, jolloin funktioP̃ : A 7→ P(A|B) kaikilla tapahtumilla A on todennäköisyys B :ssä.
Jukka Kemppainen Mathematics Division 9 / 32
Ehdolllisen todennäköisyyden ominaisuudet
Ehdollinen tn. P̃ on siis tn. B :ssä ja P on tn. S :ssä sekä P̃voidaan laskea alkuperäisen tn:n P avulla.Ehdollinen tn. P̃ täyttää kaikki todennäköisyydeltä vaadittavatominaisuudet. Esimerkiksi
1. 0 ≤ P̃(A) = P(A|B) ≤ 1 kaikilla tapahtumilla A
2. P̃(B) = P(B |B) = 1;
3.
P̃(A1 ∪ A2) = P(A1 ∪ A2|B) = P(A1|B) + P(A2|B)
= P̃(A1) + P̃(A2).
aina, kun A1 ∩ A2 = ∅.
Jukka Kemppainen Mathematics Division 10 / 32
Huomioita
Esitetään joitakin tärkeitä huomioita ehdolliseentodennäköisyyteen liittyen.
◮ Todennäköisyydessä P(A|B)◮ A on tapahtuma, jonka tn. halutaan laskea, ja◮ B on ehto, jonka suhteen tn. lasketaan.
◮ YleisestiP(A|B) 6= P(B |A).
◮ Todennäköisyyden tulkinnassa täytyy olla varovainen. Yleisesti
P(A|B) 6= P(A).
Käsitellään näitä tarkemmin esimerkeissä.
Jukka Kemppainen Mathematics Division 11 / 32
Kertolaskusääntö
Ehdollisen todennäköisyyden määritelmä voidaan esittää kahtenakertosääntönä
P(A ∩ B) = P(B)P(A|B), jos P(B) > 0
P(A ∩ B) = P(A)P(B |A), jos P(A) > 0
Samaa periaatetta voidaan soveltaa myös useammalletapahtumalle. Jos esimerkiksi tapahtumia on kolme jaP(B ∩ C ) > 0, saadaan
P(A ∩ B ∩ C ) = P(A ∩ (B ∩ C ))
= P(A|B ∩ C )P(B ∩ C )
= P(A|B ∩ C )P(B |C )P(C ).
Jukka Kemppainen Mathematics Division 12 / 32
Kertolaskusääntö
Samaa kertolaskusääntöä voidaan käyttää kuinka monelletapahtumalle hyvänsä. Täydellisellä induktiolla voidaan todistaa:
Lause 2
Olkoot A1,A2, . . . ,An ∈ E siten, että P(A1 ∩ · · · ∩ An−1) > 0.Tällöin on voimassa
P(A1 ∩ A2 ∩ · · · ∩ An) =P(A1)P(A2|A1)P(A3|A2 ∩ A1) · · ·
· · ·P(An|A1 ∩ · · · ∩ An−1).
Jukka Kemppainen Mathematics Division 13 / 32
Esimerkkejä
Esim. 2
Tuotteessa voi olla materiaalivika (tapahtuma A) tai käsittelyvika(tapahtuma B). Tuote on “susi”, jos siinä on molemmat viat.Olkoot P(A) = 0,1, P(B) = 0,06 ja P(A ∩ B) = 0,005. Mikä ontodennäköisyys, että
(a) tuote on “susi” ehdolla, että siinä on ainakin yksi vika?
(b) tuotteessa on materiaalivika ehdolla, että siinä on tarkalleenyksi vika?
Esim. 3
Pokerissa kullekin pelaajalle jaetaan viisi korttia. Jos pelaajia on 2,niin millä todennäköisyydellä molemmat saavat 2 ässää?
Jukka Kemppainen Mathematics Division 14 / 32
Kokonaistodennäköisyys◮ Olkoon {A1,A2} on otosavaruuden S ositus eli
A1 ∩ A2 = ∅ ja A1 ∪ A2 = S .
◮ Oletetaan, että P(Ai) > 0, i = 1, 2.◮ Olkoon B tapahtuma, jolle P(B) > 0. Tällöin
(A1 ∩ B) ∪ (A2 ∩ B) = B
(A1 ∩ B) ∩ (A2 ∩ B) = ∅
jaP(B) = P(A1 ∩ B) + P(A2 ∩ B).
◮ Toisaalta kertolaskusäännön nojalla i = 1, 2:
P(Ai ∩ B) = P(B |Ai)P(Ai). (1)
Jukka Kemppainen Mathematics Division 15 / 32
Kokonaistodennäköisyys
Edellä osituksen {A1,A2} tapauksessa saadaankokonaistodennäköisyydeksi
P(B) = P(A1)P(B |A1) + P(A2)P(B |A2)
Yleisesti, jos {A1,A2, . . . ,An} on ositus, saadaan
Lause 3 (Kokonaistodennäköisyyden kaava)
P(B) =
n∑
k=1
P(Ak)P(B |Ak).
Jukka Kemppainen Mathematics Division 16 / 32
Puukaavio (1/3)
Kokonaistodennäköisyyttä kannattaa usein hahmotella puukaavionavulla.Useinkaan emme tiedä jonkin tapahtuman B todennäköisyyttäsuoraan, jolloin B kannattaa ehdollistaa sellaisilla tapahtumilla Ak ,jotka muodostavat osituksen ja ehdolliset todennäköisyydetP(B |Ak) voidaan laskea.Erityisesti {A,A} muodostaa S :n osituksen, jolloin tapahtuman Btodennäköisyyttä voidaan hahmottaa seuraavan puukaavion avulla.
Jukka Kemppainen Mathematics Division 17 / 32
Puukaavio (2/3)
p1
A
p2
A
q1
B
q2
B
q̃1
B
q̃2
B
Jukka Kemppainen Mathematics Division 18 / 32
Puukaavio (3/3)
Puukaaviossa kustakin ”lehdestä” (ympyrästä) lähtevien ”oksien”todennäköisyyksien summa on yksi eli
p1 + p2 = q1 + q2 = q̃1 + q̃2 = 1.
Todennäköisyys voidaan laskea tuloperiaatteella. Esimerkiksipunaista reittiä pitkin laskettu todennäköisyys on
P(B |A)P(A) = q1 · p1,
ja tapahtuman B kokonaistodennäköisyydeksi saadaan
P(B) = P(B |A)P(A) + P(B |A)P(A) = p1 · q1 + p2 · q̃1.
Jukka Kemppainen Mathematics Division 19 / 32
Esimerkki
Esim. 4
Korttipakan 52 kortista nostetaan umpimähkääntakaisinpanematta kaksi korttia. Mikä on todennäköisyys, ettätoinen kortti on pata?
Jukka Kemppainen Mathematics Division 20 / 32
Bayesin kaava
Käyttämällä kaavaa (1) saadaan ehdolliselle todennäköisyydelleBayesin kaava
P(Ak |B) =P(Ak ∩ B)
P(B)=
P(B |Ak)P(Ak)
P(B),
joka kokonaistodennäköisyyden kaavaan mukaan voidaan kirjoittaamuodossa
Lause 4 (Bayesin kaava)
P(Ak |B) =P(B |Ak)P(Ak)∑n
k=1P(Ak)P(B |Ak)
.
Jukka Kemppainen Mathematics Division 21 / 32
Bayesin kaava (2/2)
Todennäköisyyttä
◮ P(Ak) sanotaan priori-todennäköisyydeksi.
- prior (lat.) (edeltävä, aikaisempi)- Käsityksemme tapahtuman Ak tn:stä ennen kuin tiedetään,
onko B sattunut vai ei.
◮ P(Ak |B) sanotaan posteriori-todennäköisyydeksi
- posterior (lat.) (jälkeen tuleva, myöhempi)- Päivitetään tapahtuman Ak tn., kun tiedetään, että B on
sattunut.
◮ P(B |Ak) sanotaan uskottavuudeksi (likelihood)
- Mikä on tapahtuman B tn., kun havaitaan Ak , eli B:nuskottavuus ehdolla Ak).
Jukka Kemppainen Mathematics Division 22 / 32
Esimerkkejä
Esim. 5
Neljä teknikkoa tekee säännöllisesti korjauksia, kun eräälläautomaatiolinjalla ilmenee vika. Teknikko 1 tekee 20%korjauksista, mutta tekee virheen keskimäärin yhdessä korjauksessasuorittamissaan 20 korjauksessa, teknikko 2 tekee 60%korjauksista ja tekee yhden virheen 10 korjauksessa, teknikko 3tekee 15% korjauksista ja tekee virheen 1 tapauksessa 10:stä jateknikko 4 tekee 5% korjauksista ja virheen 1 tapauksessa 20:sta.Automaatiolinjalla ilmenee vika ja sen diagnosoidaan johtuvanvirheellisestä korjauksesta. Millä todennäköisyydellä korjauksen ontehnyt teknikko 1?
Jukka Kemppainen Mathematics Division 23 / 32
Esimerkkejä
Esim. 6
Tutkimusten mukaan HIV esiintyy väestössä todennäköisyydellä0,0004. Sairautta tutkitaan verikokeella, jossa on seuraavatvirhemahdollisuudet:
(i) sairaan henkilön testitulos on negatiivinen todennäköisyydellä0,001;
(ii) terveen henkilön testitulos on positiivinen todennäköisyydellä0,002.
Millä todennäköisyydellä satunnaisesti valitulla, positiivisentestituloksen saaneella henkilöllä todella on HIV?
Jukka Kemppainen Mathematics Division 24 / 32
Esimerkkejä
Esim. 7
Tenttitehtävässä on väittämiä, joista kuhunkin tenttijän pitäävastata valitsemalla toinen kahdesta vaihtoehdosta (kyllä tai ei).Turo Teekkarin asiat ovat niin kehnosti, että hän tietää vastauksenvain 60 % väittämistä ja loput hän veikkaa täysin umpimähkään.
(a) Millä todennäköisyydellä Turo vastaa oikein (tietämällä taiveikkaamalla) satunnaisesti valittuun väittämään?
(b) Jos Turo vastasi oikein satunnaisesti valittuun väittämään,niin mikä on todennäköisyys, että hän päätyi oikeaanvastaukseen tietämällä eikä veikkaamalla?
Jukka Kemppainen Mathematics Division 25 / 32
Riippumattomuus
Määr. 4
Tapahtumat A ja B ovat riippumattomia, jos
P(A ∩ B) = P(A)P(B). (2)
Huomautus 3
◮ Tulosääntöä (2) voidaan käyttää vain riippumattomilletapahtumille!
◮ Tilastollinen riippumattomuus on todennäköisyysfunktionominaisuus ja on eri asia kuin joukko-opillinen erillisyys.
Jukka Kemppainen Mathematics Division 26 / 32
Esimerkki
Esim. 8
Valitaan korttipakasta satunnaisesti yksi kortti. Olkoot
◮ A = ”kortti on pata”;
◮ B = ”kortti on ässä”;
◮ C = ”kortti on hertta”.
tapahtumia. Tutki, ovatko
(a) A ja B riippumattomia.
(b) A ja C riippumattomia.
(c) B ja C riippumattomia.
Jukka Kemppainen Mathematics Division 27 / 32
Riippumattomien tapahtumienominaisuuksia
◮ Jos P(B) = 0, niin B on riippumaton mistä tahansatapahtumasta A.
◮ Jos P(B) > 0, niin
A ja B ovat riippumattomia ⇔ P(A|B) = P(A).
eli B :n esiintyminen ei vaikuta tapahtuman Atodennäköisyyteen.
Lause 5
Tapahtumat A ja B ovat riippumattomia, jos ja vain jos mikätahansa seuraavista ominaisuuksista on voimassa
(a) A ja B ovat riippumattomia.
(b) A ja B ovat riippumattomia.
(c) A ja B ovat riippumattomia.
Jukka Kemppainen Mathematics Division 28 / 32
Usean tapahtuman riippumattomuus
Määr. 5
Tapahtumat A1, . . . ,An ovat (keskinäisesti) riippumattomia, joskaikille indeksijoukoille {i1, . . . , ik} ⊂ {1, . . . , n}
P(Ai1 ∩ · · · ∩ Aik ) = P(Ai1)P(Ai2) . . .P(Ain).
Tulosääntö pätee kaikille osajoukoille. Ei riitä, että tulosääntöpätee pareittain
P(Ai ∩ Aj) = P(Ai)P(Aj) kaikilla i 6= j .
Jukka Kemppainen Mathematics Division 29 / 32
Riippumattomien tapahtumien yhdiste jaleikkausUsean tapahtuman leikkauksen ja yhdisteen todennäköisyydenlaskeminen helpottuu huomattavasti riippumattomien tapahtumientapauksessa.
◮ Olkoot tapahtumat A1,A2, . . . ,An riippumattomia.◮ Todennäköisyys tapahtumalle ”kaikki tapahtumat Ai
sattuvat” on (vrt. Lause 2)
P(A1 ∩ A2 ∩ · · · ∩ An) = P(A1)P(A2) · · ·P(An)
◮ Todennäköisyys tapahtumalle "ainakin yksi tapahtumista Ai
sattuu"
P(A1 ∪ A2 ∪ · · · ∪ An) =1 − P(A1 ∩ A2 ∩ · · · ∩ An)
=1 −(1 − P(A1)
)· · ·
(1 − P(An)
).
Jukka Kemppainen Mathematics Division 30 / 32
Esimerkki
Edellä olevia ominaisuuksia tarvitaan esimerkiksi komponenttienluotettavuuden arvioinnissa.
Esim. 9
Systeemi koostuu kolmesta rinnankytketystä identtisestäkomponentista. Systeemi toimii, jos ainakin yksi kolmestarinnakkaisesta komponentista on toimiva. Jokaisen komponentinkestoikä on yli 10 viikkoa todennäköisyydellä 0.2. Millätodennäköisyydellä kokonaissysteemin virheetön toiminta-aika onyli 10 viikkoa?
Jukka Kemppainen Mathematics Division 31 / 32
Riippumattomuus käytännössä
Usein riippumattomuus on käytännössä oletus, joka on”ilmiselvästi” voimassa. Esimerkiksi
◮ kolikon tai nopan heitto. Heittojen tulokset eivät riiputoisistaan.
◮ ottelukierroksen tulokset (vakioveikkauksessa). Pelienlopputulokset ovat riippumattomia toisistaan.
Näin oletamme, ellei toisin mainita. Joskus oletukset on syytäasettaa kyseenalaiseksi. Esimerkiksi
◮ havaitaan epätavalliset vetosuhteet ottelukierroksella(sopupeli).
Riippumattomuus helpottaa laskentaa, mutta oletusriippumattomuudesta on syytä asettaa kyseenalaiseksi.
Jukka Kemppainen Mathematics Division 32 / 32