yhtälöiden ratkaisemisestajultika.oulu.fi/files/nbnfioulu-201501171028.pdff(x) = ( 1)f(x), on...

Yhtälöiden ratkaisemisesta

Pro gradu-tutkielmaAntti Pekkala

1988723Matemaattisten tieteiden laitos

Oulun yliopistoSyksy 2014

Sisältö

Johdanto 2

1 Renkaista ja kunnista 3

2 Polynomit renkaassa K[x] 62.1 Peruskäsitteistöä . . . . . . . . . . . . . . . . . . . . . . . . . 62.2 Jakoalgoritmi . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3 Polynomeista renkaassa Q[x] 9

4 Polynomien nollakohdista ja yhtälöiden juurista 114.1 Toinen aste . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114.2 Kolmas aste . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134.3 Neljäs aste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194.4 Trigonometriaan perustuva ratkaisu . . . . . . . . . . . . . . . 224.5 Viides aste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

5 Yhtälöiden historiaa 265.1 Ensimmäinen ja toinen aste . . . . . . . . . . . . . . . . . . . 265.2 Kolmas ja nejäs aste . . . . . . . . . . . . . . . . . . . . . . . 275.3 Viides aste ja Galois'n teoria . . . . . . . . . . . . . . . . . . . 28

Lähdeluettelo 30

1

Johdanto

Tulevana matematiikan aineenopettajana yhtälöiden ratkaisemista käsittele-vä tutkielma tuntui itselle juuri sopivalta. Tutkielma käsittelee toisen, kol-mannen ja neljännen asteen yhtälöitä ja niiden ratkaisemista. Vaikka tämäon huomattavasti lukiomatematiikkaakin haastavampaa, uskon siitä olevanhyötyä jatkossa. Aihe on hyvää lisätietoa, sillä toisen asteen yhtälön ratkai-sukaava on yksi käytetyimpiä työkaluja lukion matematiikassa.

Tutkielmassa joudutaan käsittelemään pääasiassa polynomeja, minkä vuok-si rakennetaan polynomirenkaan käsite. Tätä varten joudutaan määrittä-mään renkaan ja kunnan käsitteet, sekä niihin liittyvä peruskäsitteistö kap-paleessa 1. Myös polynomirenkaille rakennetaan peruskäsitteistö ja niidenyhteyteen tarvittavat määritelmät ja työkalut. Nämä käsitellään sekä yleisil-le polynomirenkaille kappaleessa 2, että rationaalilukukertoimisille polyno-mirenkaille kappaleessa 3. Näiden jälkeen on mahdollista muodostaa toisen,kolmannen ja neljännen asteen yhtälöiden ratkaisukaavat kappaleessa 4. Näi-tä ratkaisukaavoja käytetään ja sovelletaan reilusti ja niihin liittyviä apukei-noja käytetään hyväksi. Lisäksi todetaan ettei viidennen asteen yhtälöille oleratkaisukaavaa olemassa.

Koska yhtälöiden ratkaiseminen ja ratkaisukaavojen löytäminen on olluthistoriallisesti merkittävää matematiikalle ja koska ratkaisukaavojen muo-dostaminen suoritetaan osittain historialliseen tyyliin, on tutkielmaan lisättyvielä historiaa käsittelevä osuus, kappale 5. Tässä käydään läpi yhtälöidenratkaisemiseen liittyvää historiaa ja sen merkitystä matematiikalle.

Tutkielmassa on käytetty lähteinä Markku Niemenmaan luentoihin poh-jautuvaa luentomonistetta ja siihen liittyviä luentoja (Lähde [1]) peruskäsit-testön luomiseen, J. J. Rotmanin teosta (Lähde [2]) ja O. E. Nicodemin teos-ta (Lähde [3]) kolmannen ja neljännen asteen yhtälöiden ratkaisukaavan jaesimerkkien tekemiseen, sekä C. B. Boyerin teosta (Lähde [4]) historiaosuu-den muodostamiseen. Muut osiot mukailevat pääosin luentomuistiinpanoja(Lähde [1]).

2

1 Renkaista ja kunnista

Tässä kappaleessa määritellään ryhmän, renkaan ja kunnan käsitteet, joitatarvitaan polynomirenkaan muodostamiseen. Sisältöä on muotoiltu luento-monistetta ja luentomuistiinpanoja [1] mukaillen niiltä osin kuin on tarvittu.

Määritelmä 1.1. Pari (G, ∗) on ryhmä, jos seuraavat ehdot täyttyvät:1◦ Assosiaatio: Alkioille x, y, z ∈ G pätee

x ∗ (y ∗ z) = (x ∗ y) ∗ z.

2◦ Ykkösalkio: On olemassa sellainen alkio 1 ∈ G, jolle kaikilla x ∈ G pätee

1 ∗ x = x = x ∗ 1.

3◦ Vasta-alkio: Jokaiselle alkiolle x on olemassa alkio x′ ∈ G, jolle pätee

x′ ∗ x = 1 = x ∗ x′.

Lisäksi ryhmää (G, ∗) kutsutaan Abelin ryhmäksi, jos sille on seuraava ehtovoimassa:4◦ Kommutaatio: Alkioille x, y ∈ G pätee

x ∗ y = y ∗ x.

Esimerkki 1.2. Pari (Z,+) ja pari (Q \ {0}, ·) ovat ryhmiä. Huomattavaaon, että ryhmän (Z,+) ykkösalkio on 0 ja kun taas ryhmällä (Q \ {0}, ·)ykkösalkio on 1. Todistetaan tämä:1◦ Assosiaatio on voimassa kokoneislukujen ja rationaalilukujen joukossa sekäyhteen- että kertolaskun suhteen.2◦ Yhteenlaskussa 0 +x = x = x+ 0 ja kertolaskussa 1 · y = y = y · 1 pätevätkaikilla x ∈ Z ja y ∈ Q.3◦ Yhteenlaskussa alkion x vasta-alkio on−x ja kertolaskussa 1

x= x−1. Koska

alkiota 10ei voida määritellä, on kertolaskun joukko (Q \ {0}, ·) jouduttu

muodostamaan ilman tätä alkiota 0.Kaikille alkioille x, y ∈ Z pätee x+ y = y+ x ja kaikille alkioille x, y ∈ Q

pätee x ·y = y ·x. Tällöin siis myös ehto 4◦ toteutuu, joten molemmat ryhmätovat Abelin ryhmiä.

Määritelmä 1.3. Ryhmän (G, ∗) epätyhjä osajoukko H on aliryhmä, mikäliseuraavat ehdot täyttyvät:1◦ Ryhmän G ykkösalkio kuuluu joukkoon H eli 1 ∈ H.2◦ Alkioille x, y ∈ H pätee x ∗ y ∈ H.3◦ Jos alkio x ∈ H, niin silloin myös vasta-alkio x′ ∈ H.

3

Lause 1.4. Ryhmän (G, ∗) aliryhmä (H, ∗) on ryhmä.

Todistus. Osoitetaan ryhmän ehtojen täyttyvän aliryhmän H alkioille.1◦ Koska aliryhmän H alkiot kuuluvat myös ryhmään G, pätee niille assosi-aatio x ∗ (y ∗ z) = (x ∗ y) ∗ z myös aliryhmässä H.2◦ Aliryhmän määritelmä sanoo, että ryhmän G ykkösalkio 1 ∈ H. Tämäykkösalkio on nyt myös aliryhmän H ykkösalkio, sillä operaatio ∗ on sama.3◦ Aliryhmän määritelmässä todetaan jokaiselle aliryhmän H alkiolle olevanvasta-alkio. Koska nämä alkiot kuuluvat ryhmään G, pätevät niiden säännötmyös aliryhmässä H.

Huomautus 1.5. Tapauksissa, missä ryhmän osajoukko tulee osoittaa ryh-mäksi on helpompi osoittaa aliryhmän käsitteen kautta. Tällöin assosiaatio-ta ei tarvitse erikseen todistaa, vaan se periytyy ryhmältä aliryhmälle.Ryhmän G aliryhmiin kuuluvat triviaalit tapaukset {1} ja ryhmä G itse. Kunpuhutaan ei-triviaaleista aliryhmistä, käytetään termiä aito aliryhmä.

Esimerkki 1.6. Ryhmän (Z,+) aliryhmä {x ∈ Z|x = 2k, k ∈ Z} samallayhteenlaskuoperaatiolla on myös ryhmä, sillä aliryhmän edellytykset toteu-tuvat.1◦ Ryhmän Z ykkösalkio 0 on nyt myös aliryhmän ykkösalkio, sillä 2 · 0 = 02◦ Aliryhmän alkioilla 2m ja 2n muodostettu alkio 2m+ 2n = 2(m+n) kuu-luu aliryhmään, sillä kokonaislukujen summa on kokonaisluku.3◦ Aliryhmän alkion 2m vasta-alkio on 2(−m) = −2m, koska 2m+ (−2m) =0. Tämä alkio kuuluu nyt aliryhmään, sillä kokonaisluvun vastaluku on myöskokonaisluku.

Määritelmä 1.7. Kolmikko (R,+, ·) on rengas, jos seuraavat ehdot täytty-vät:1◦ Pari (R,+) on Abelin ryhmä (eli kommutatiivinen ryhmä).2◦ Operaatio (· ) on assosiatiivinen operaatio joukossa R, eli a·(b·c) = (a·b)·c.3◦ On olemassa ykkösalkio 1 ∈ R, jolle 1a = a = a1 kaikilla a ∈ R.4◦ a · (b+ c) = a · b+ a · c ja (a+ b) · c = a · c+ b · c kaikilla a, b, c ∈ R.Lisäksi sanotaan, että rengas on kommutatiivinen, mikäli kertolaskuoperaa-tio (·) on kommutatiivinen, eli seuraava ehto on voimassa.5◦ a · b = b · a kaikilla a, b ∈ R

Huomautus 1.8. Renkaan määrittelyssä käytetyt operaatiot + ja · merkitäänjuuri näillä symboleilla, koska niitä tullaan jatkossa käyttämään yhteen- jakertolasku operaattoreina. Annettu määritelmä ei kuitenkaan rajoita näitäoperaatioita olemaan juuri yhteenlaskua ja kertolaskua, vaan ne voivat ollajotain muutakin. Merkitään jatkossa kertolasku ilman operaattorimerkintää,eli a · b = ab.

4

Esimerkki 1.9. Rationaalilukujen joukko Q varustettuna yhteen- ja kerto-laskulla on rengas:1◦ (Q,+) on Abelin ryhmä, sillä yhteenlasku on assosiatiivinen ja kommuta-tiivinen rationaaliluvuilla ja tässä joukossa on ykkösalkio 0 sekä käänteisalkio−a.2◦ Rationaalilukujen välinen kertolasku on tunnetusti assosiatiivinen, kutenmyös esimerkissä 1.2 todettiin.3◦ On olemassa ykkösalkio 1Q = 1, jolle 1a = a = a1 kaikilla a ∈ Q4◦ Selvästi myös ehdot a(b+ c) = ab+ac ja (a+ b)c = ac+ bc pätevät kaikillaa, b, c ∈ Q.

Esimerkki 1.10. Myös kokonaislukujen joukko Z varustettuna yhteen- jakertolaskulla on rengas. Alla olevia ehtoja osoitettiin osittan esimerkissä 1.2.1◦ (Z,+) on Abelin ryhmä esimerkin 1.2 perusteella.2◦ Kokonaislukujen välinen kertolasku on assosiatiivinen, kuten esimerkissä1.2 todettiin.3◦ Kokonaislukujen kertolaskun ykkösalkio on 1, sillä 1x = x = x1 kaikillex ∈ Z.4◦ Myös ehdot a(b + c) = ab + ac ja (a + b)c = ac + bc pätevät joukossa Z,jos ne kerran pätevät esimerkin 1.9 mukaan joukossa Q.

Määritelmä 1.11. Rengas (K,+, ·) on kunta, jos seuraavat ehdot täyttyvät:1◦ K on kommutatiivinen rengas.2◦ Pari (K \ {0}, ·) on ryhmä.

Tässä yhteydessä alkiolla 0 tarkoitetaan kunnan alkiota, jolle (+) ope-raation suhteen on voimassa a+ 0 = a = 0 + a.

Huomautus 1.12. Kunnan määritelmästä seuraa välittömästi, että ryhmä(K \ {0}, ·) on Abelin ryhmä, sillä kommutatiivinen rengas edellyttää ope-raation (·) kommutatiivisuutta.

Esimerkki 1.13. Rationaalilukujen joukko Q varustettuna yhteen- ja ker-tolaskulla on kunta:1◦ Nyt Esimerkin 1.9 mukaan Q on rengas, ja koska kertolasku on kommu-tatiivinen rationaalilukujen kesken, on Q kommutatiivinen rengas.2◦ Nyt on jo todettu, että kertolasku on assosiatiivinen, joten riittää löytääykkösalkio ja käänteisalkio. Ne ovat 1Q = 1 ja a−1 = n/m, kun a = m/n.Huomattavaa on, ettei alkiolle 0 ∈ Q löydy käänteisalkiota, mitä tosin eivaaditakaan.

5

Esimerkki 1.14. Toisin kuin rationaaliluvuille, kokonaislukujen renkaastaZ ei voi muodostaa kuntaa. Tämä johtuu siitä, että (Z \ {0}, ·) ei ole ryh-mä. Se täyttää muut ryhmän ehdot, muttei vasta-alkion ehtoa. Vasta-alkiokokonaisluvulle x olisi 1

x, mikä on rationaaliluku, muttei kokonaisluku.

2 Polynomit renkaassa K[x]

Tässä kappaleessa esitetään polynomirenkaan määritelmä ja siihen liittyviähyödyllisiä apuvälineitä. Sisältöä on muotoiltu luentomonistetta ja luento-muistiinpanoja [1] mukaillen.

2.1 Peruskäsitteistöä

Määritelmä 2.1. Kolmikkoa (K[x],+, ·), missäK[x] = {a0 +a1x+ . . .+anx

n | n ≥ 0, ai ∈ K,K on kunta} ja operaatiot (+)ja (·) ovat polynomien yhteen- ja kertolasku, kutsutaan polynomirenkaaksi.

Lause 2.2. Polynomirengas on kommutatiivinen rengas.

Todistus. Tarkastellaan renkaan ehdot ja katsotaan lopuksi, että rengas onkommutatiivinen:1◦Olkoon f(x), g(x) ja h(x) joukon K[x] polynomeja. Nyt tiedetään, että(+) on assosiatiivinen operaatio. Lisäksi kunnan K ykkösalkio 1K ∈ K[x] onselvästi ryhmän (K[x],+) ykkösalkio. Ja koska käänteisalkio −f(x), missä−f(x) = (−1)f(x), on olemassa, ja polynomien summa on kommutatiivinen,on (K[x],+) Abelin ryhmä.2◦Polynomien kertolasku (·) on selvästi assosiatiivinen3◦Kunnan K ykkösalkio 1K on myös renkaan ykkösalkio, jolloin 1Kf(x) =f(x) = f(x)1K .4◦Nyt seuraavat yhtälöt pitävät paikkaansa

f(x)(g(x)+h(x)) = f(x)g(x)+f(x)h(x) ja (f(x)+g(x))h(x) = f(x)h(x)+g(x)h(x)

kaikilla f(x), g(x) ja h(x) ∈ K[x] polynomien laskusääntöjen nojalla.Lisäksi kommutatiivisuus f(x)g(x) = g(x)f(x) on myös voimassa polyno-mien laskusääntöjen nojalla.

Määritelmä 2.3. Polynomin asteeksi sanotaan polynomin korkeinta astettaolevan termin eksponenttia, eli polynomin f(x) = a0 + a1x+ . . .+ anx

n asteon n. Tätä merkitään seuraavasti: deg f(x) = n. Jos polynomi on nollastapoikkeava vakiopolynomi, eli muotoa f(x) = a0 6= 0, niin sen aste on 0.Mikäli f(x) = 0, niin sen aste on −∞.

6

Määritelmä 2.4. Jos f(x) = q(x)g(x), niin sanotaan, että g(x) jakaa poly-nomin f(x). Merkitään g(x) | f(x).

Määritelmä 2.5. Polynomi f(x) ∈ K[x] on jaoton, mikäli deg f(x) ≥ 1 japolynomia f(x) ei voi esittää kahden positiivista astetta olevan polynomintulona.

Määritelmä 2.6. Jos f(x) = a0 + a1x + . . . + anxn, α ∈ K ja f(α) =

a0 + a1α + . . . + anαn = 0, niin α on polynomin f(x) nollakohta. Voidaan

myös sanoa, että α on polynomin f(x) juuri.

Esimerkki 2.7. Nyt kunnasta (Q,+, ·) muodostettu rengas Q[x] on po-lynomirengas. Tämä rengas sisältää muun muassa polynomit 0, 1, f(x) =3/4x3 + 6 ja p(x) = x2 − 2, joista p(x) on jaoton kunnassa Q, eli ei oleolemassa kunnan Q alkiota α, jolle p(α) = 0 (Lemman 2.9 perusteella). Huo-mattavaa kuitenkin on, että reaalilukujen kunnassa R tälläinen löytyy, elip(x) = x2 − 2 = 0, kun x =

√2.

2.2 Jakoalgoritmi

Osoitetaan seuraavaksi tärkeä polynomeihin liittyvä lause.

Lause 2.8 (Jakoalgoritmi). Jos polynomit f(x) ∈ K[x] ja g(x) ∈ K[x] jag(x) 6= 0, niin

f(x) = q(x)g(x) + r(x)

missä q(x) ∈ K[x] ja r(x) ∈ K[x] ovat yksikäsitteiset ja deg r(x) < deg g(x).

Todistus. Muodostetaan joukko S = {f(x) − g(x)s(x) | s(x) ∈ K[x]}. NytJoukossa S on pienintä astetta oleva termi, merkitään sitä polynomilla r(x).Tällöin r(x) = f(x)− g(x)s(x), joten

f(x) = q(x)g(x) + r(x)

jollain polynomilla q(x) ∈ K[x].Osoitetaan seuraavaksi, että polynomin r(x) aste on pienempää kuin poly-nomin g(x) aste. Merkitään

g(x) = b0 + b1x+ . . .+ bmxm ja r(x) = c0 + c1x+ . . .+ ctx

t,

jolloin deg g(x) = m ja deg r(x) = t. Tehdään nyt vastaoletus, että t ≥ m.Muodostetaan uusi polynomi

h(x) = f(x)− q(x)g(x)− (ct/bm)xt−mg(x) = r(x)− (ct/bm)xt−mg(x)

7

jonka jälkimmäinen osa on muotoa r(x) − (ctxt + . . .), eli polynomin h(x)

aste on pienempää kuin polynomin r(x) aste t. Kirjoittamalla polynomi h(x)uuteen muotoon, saadaan kuitenkin h(x) = f(x)− g(x)(q(x) + (ct/bm)xt−m),eli h(x) ∈ S. Tämä on kuitenkin ristiriidassa sen olettamuksen kanssa, jonkamukaan r(x) ∈ S on joukon pienintä astetta oleva polynomi. Tällöin vastao-letus on väärä ja t < m eli deg r(x) < deg g(x).Vielä täytyy osoittaa polynomien q(x) ja r(x) ∈ K[x] yksikäsitteisyys. Olkoot

f(x) = q1(x)g(x) + r1(x)

jaf(x) = q2(x)g(x) + r2(x)

josta toisistaan vähentämällä saadaan

g(x)[q1(x)− q2(x)] = r2(x)− r1(x).

Koska polynomien r1(x) ja r2(x) aste on pienempää kuin polynomin g(x)aste, on myös niiden erotuksen r2(x)− r1(x) aste pienempää kuin polynoming(x) aste. Tällöin on oltava q1(x) − q2(x) = 0 eli q1(x) = q2(x) ja edelleenr2(x) − r1(x) = 0 eli r1(x) = r2(x). Tällöin polynomit q(x) ja r(x) ovatyksikäsitteiset.

Lemma 2.9. Olkoon f(x) ∈ K[x] ja α ∈ K. Nyt f(α) = 0 tarkalleen silloin,

kun (x− α) | f(x).

Todistus. Todistetaan väite molempiin suuntiin. Jos (x − α) | f(x), niinf(x) = (x− α)q(x) ja f(α) = (α− α)q(α) = 0.Jos taas f(α) = 0, niin sovelletaan jakoalgoritmia polynomeihin f(x) ja(x− α). Silloin

f(x) = (x− α)q(x) + r(x),

missä deg r(x) < deg (x− α) = 1. Tällöin r(x) = c ∈ K, eli f(x) = (x −α)q(x) + c. Koska f(α) = (α − α)q(x) + c = 0, on polynomin r(x) edelleenoltava 0. Nyt siis f(x) = (x− α)q(x), eli (x− α) | f(x).

Lemma 2.10. Olkoon f(x) ∈ K[x] ja deg f(x) = n. Tällöin polynomilla

f(x) on korkeintaan n nollakohtaa kunnassa K.

Todistus. Olkoot a1, a2, . . . , am polynomin f(x) kaikki nollakohdat kunnassaK. Nyt Lemman 2.9 perusteella q(x) = (x − a1) . . . (x − am) | f(x), jolloinjakoalgoritmin perusteella deg q(x) = m ≤ n

8

3 Polynomeista renkaassa Q[x]

Rationaalilukukertoiminen rengas on polynomirenkaan K[x] erikoistapaus.Tässä kappaleessa on tarkoitus luoda työkaluja kokonaislukukertoimisten po-lynomien käsittelyyn renkaassa Q[x]. Määritelmät ja lauseet noudattavatluentomonistetta ja luentomuistiinpanoja [1].

Määritelmä 3.1. Polynomin f(x) = a0 + a1x+ . . .+ anxn ∈ Z[x] yhteinen

kerroin, eli syt(a0, a1, . . . , an) on 1, niin polynomia f(x) kutsutaan silloinalkeispolynomiksi.

Lemma 3.2. Kahden alkeispolynomin tulo on alkeispolynomi.

Todistus. Olkootf(x) = a0 + a1x+ . . .+ anx

n ∈ Z[x] jag(x) = b0 + b1x+ . . .+ bmx

m ∈ Z[x] alkeispolynomeja.Tarkastellaan niiden tuloa f(x)g(x) ja tehdään vastaoletus: f(x)g(x) ei olealkeispolynomi. Tällöin on olemassa ainakin sellainen alkuluku p ∈ Z jokajakaa polynomin f(x)g(x) kaikki kertoimet. Koska polynomit f(x) ja g(x)ovat alkeispolynomeja, on olemassa sellaiset kertoimet aj ja bk, joita p eijaa. Oletetaan lisäksi, että nämä kertoimet ovat polynomien ensimmäisettälläiset kertoimet, jolloin p |a0, p |a1, . . . , p |aj−1 ja p |b0, p |b1, . . . , p |bk−1.Nyt polynomin f(x)g(x) termin xj+k kerroin cj+k on muotoa

cj+k = ajbk+[aj+1bk−1+aj+2bk−2+. . .+aj+kb0]+[aj−1bk+1+aj−2bk+2+. . .+a0bj+k].

Merkitääncj+k = ajbk + A+B.

Koska f(x)g(x) on alkeispolynomi, pätee p |cj+k. Nyt myös p |a0, p |a1, . . . , p |aj−1,joten p |B. Vastaavasti myös p |b0, p |b1, . . . , p |bk−1, joten myös p |A. Tästäseuraa se, että myös p |ajbk, eli joko p |aj tai p |bk, mistä seuraa ristiriita.Tällöin vastaoletus on väärä ja polynomi f(x)g(x) on alkeispolynomi.

Lemma 3.3. Jos alkeispolynomi f(x) voidaan esittää kahden rationaaliker-

toimisen polynomin tulona, niin f(x) voidaan esittää kahden kokonaisluku-

kertoimisen polynomin tulona.

Todistus. Olkoon f(x) = u(x)v(x), missä u(x), v(x) ∈ Q[x]. Tällöin f(x) =abt(x)d(x), missä a, b ∈ Z ja t(x) ja d(x) ovat alkeispolynomeja. Täten

bf(x) = at(x)d(x).

Koska f(x) on alkeispolynomi, on sen yhteinen kerroin 1 ja polynomin bf(x)yhteinen kerroin b. Polynomi t(x)d(x) on alkeispolynomi oletuksen ja Lem-man [3.2] nojalla. Tällöin polynomin at(x)d(x) yhteinen kerroin on a. Koska

9

bf(x) = at(x)d(x), on tällöin oltava a = b. Tällöin polynomi f(x) supistuumuotoon f(x) = a

at(x)d(x) = t(x)d(x). Tämä tarkoittaa sitä, että alkeispoly-

nomi f(x) on esitetty kahden kokonaislukukertoimisen polynomin tulona.

Esimerkki 3.4. Polynomi f(x) = 7x3 + 37x2 + 31x + 6 on alkeispolyno-mi, sillä syt(7, 37, 31, 6) = 1. Tiedetään, että polynomi f(x) voidaan esittäärationaalilukukertoimisen polynomin tulona, sillä

7x3 + 37x2 + 31x+ 6 = (3

5x2 + 3x+

9

5)(

35

3x+

10

3).

Tällöin polynomi voidaan esittää myös lemman 3.3 nojalla myös kokonaislu-kukertoimisten polynomien tulona. Tällöin

f(x) = (3

5x2 + 3x+

9

5)(

35

3x+

10

3) =

3

5(x2 + 5x+ 3)

5

3(7x+ 2)

f(x) = (x2 + 5x+ 3)(7x+ 2).

Lause 3.5 (Eisensteinin kriteeri). Olkoon f(x) = anxn+. . .+a1x+a0 ∈ Z[x]

ja olkoon p sellainen alkuluku, että p - an, p|an−1, . . . , p|a1, p|a0, mutta p2 - a0.Tällöin polynomi f(x) on jaoton renkaassa Q[x].

Todistus. Jos polynomi f(x) ei ole alkeispolynomi, niin tästä muodostettupolynomi f(x)/syt(a0 . . . an) on. Koska p - an, niin p - syt(a0 . . . an). Tällöinvoidaan merkitä polynomia f(x)/syt(a0 . . . an) = g(x). Tälle polynomille pä-tee samat ehdot kuin polynomille f(x). Tämän vuoksi voidaan olettaa, ettäpolynomi f(x) on alkeispolynomi, sillä todistus voidaan suorittaa myös po-lynomille g(x).

Tehdään vastaoletus; polynomi f(x) on jaollinen polynomirenkaassa Q[x].Tällöin polynomi voidaan kirjoittaa muodossa f(x) = u(x)v(x), missä po-lynomit u(x) ja v(x) ∈ Q[x] sekä deg u(x) ja deg v(x) ≥ 1. Lemman [3.3]nojalla polynomi f(x) voidaan esittää kahden kokonaislukukertoimisen po-lynomin tulona. Olkoon siis

f(x) = (brxr + . . .+ b1x+ b0)(csx

s + . . .+ c1x+ c0),

missä bi, ci ∈ Z ja r, s ≥ 1. Tällöin n = r + s, an = brcs ja a0 = b0c0.Koska p|a0, mutta p2 - a0, niin alkuluku p jakaa joko luvun b0 tai c0, mut-tei molempia. Oletetaan, että p|b0, jolloin p - c0. Tarkastellaan nyt joukkoab0, b1, . . . , br. Tässä joukossa on ainakin yksi termi, jolle pätee p - bi, silläp - an = brcs. Oletetaan, että termi bk on näistä ensimmäinen, jota alkulukup ei jaa, eli p|b0, . . . p|bk−1, mutta p - bk. Koska n = r + s ≥ k + s ≥ k + 1,niin k < n. Tästä seuraa, että p|ak oletuksen nojalla. Nyt termi ak on muo-toa ak = bkc0 + bk−1c1 + bk−2c2 + . . .. Tässä termeille bk−1, bk−2, . . . pätee

10

ehto p|bi vakion k valinnan perusteella. Tästä seuraa siis, että myös ehdotp|bk−1c1, p|bk−2c2, . . . pätevät. Tämän perusteella alkuluku p jakaa myös ter-min bkc0, jolloin joko p|bk tai p|c0. Tämä on kuitenkin edellisen perusteellamahdotonta, jolloin vastaoletuksemme on väärä ja väitteemme totta.

Esimerkki 3.6. Polynomi 7x3 + 8x2 + 4x+ 2 on jaoton, sillä alkuluku p = 2jakaa luvut 8, 4 ja 2, mutta 2 - 7 ja 4 - 2.Vastaavasti polynomi x11−3 on myös jaoton, sillä nollakertoimisille termeilleehto pätee, onhan 0 · 3 = 0 kokonaisluku eli 3|0. Itse asiassa kaikille polyno-meille, jotka ovat muoto xn − p, missä n ≥ 2, ovat jaottomia.

Huomautus 3.7. Huomattavaa on, että lause 3.5 toimii vain yhteen suun-taan. Esimerkiksi polynomi f(x) = x3 − 4 on jaoton mutta lauseen ehtojatäyttävää alkulukua p ei ole olemassa. Joissain tapauksissa tämä ongelmavoidaan kuitenkin kiertää tekemällä polynomiin lineaarinen muunnos. Esi-merkiksi polynomi g(x) = f(x + 1) = x3 + 3x2 + 3x − 3 on Eisensteininkriteerien perusteella jaoton, jolloin myös polynomi f(x) on jaoton.

4 Polynomien nollakohdista ja yhtälöiden juu-

rista

Käsiteltäessä tässä kappaleessa polynomeja oletetaan, että ne kuuluvat poly-nomirenkaaseen C[x]. Tämä johtuu neliöjuuren käytöstä, sillä neliöjuuriter-miä sisältävät juuret voivat olla irrationaalisia tai kompleksisia. Usein kui-tenkin käsiteltävät polynomit ovat kokoneislukukertoimisia.

4.1 Toinen aste

Tämä kappale on muotoiltu luentomonistetta ja luentomuistiinpanoja [1] mu-kaillen.

Toisen asteen polynomi on yleisesti muotoa ax2 + bx + c = 0. Yhtälönratkaisemisen kannalta epäolennainen kerroin a voidaan jättää pois, sillä sevoidaan jakaa yhtälöstä pois, jolloin yhtälö on muotoa x2 + b

ax + c

a= 0.

Käytetään siis muotoa x2 + bx+ c = 0 yksinkertaisuuden vuoksi.Mikäli yhtälöön sijoitetaan muuttujan x paikalle termi y − b/2, saadaan

ensimmäisen asteen termi supistettua pois, eli

y2 − by +b2

4+ by − b2

2+ c = 0

y2 =b2

4− c

11

y = ±√b2 − 4c

4.

Kun tämä sijoitetaan takaisin alkuperäiseen yhtälöön, saadaan

x = − b2±√b2 − 4c

2.

Tätä kutsutaan nyt toisen asteen yhtälön klassiseksi ratkaisukaavaksi. Täl-laisiksi kutsutaan ratkaisukaavoja, joihin on käytetty peruslaskutoimituksia(+,−, ·, /), juuri- ja potenssilausekkeita, sekä polynomin kertoimia. Näitäsaatuja kahta ratkaisua kutsutaan nyt yhtälön juuriksi ja yhtälöä vastaavantoisen asteen polynomin f(x) = x2 + bx+ c nollakohdiksi, jolloin

f(− b2

+

√b2 − 4c

2) = 0 = f(− b

2−√b2 − 4c

2).

Toisen asteen yhtälön juuria on siis kaksi. Neliöjuurilausekkeen arvostariippuen ratkaisut voivat kuitenkin olla reaalisia tai kompleksisia. Mikäli ne-liöjuuren sisällä olevan lauseen arvo on positiivinen, ovat ratkaisut reaalisiaja mikäli negatiivinen, ovat ratkaisut kompleksisia. Tätä varten määritelläändiskriminatin käsite.

Määritelmä 4.1. Olkoon toisen asteen polynomin f(x) = x2 + bx+ c juuretu1 ja u2. Merkitään nyt

∆ = u1 − u2 = − b2

+

√b2 − 4c

2−[− b

2−√b2 − 4c

2

]=√b2 − 4c,

jolloin ∆2 = b2 − 4c. Lukua ∆2 kutsutaan nyt polynomin f(x) diskriminan-

tiksi.

Nyt siis edelliset perustelut pätevät diskriminantille. Toisen asteen yhtä-lön diskrimantin ollessa positiivinen eli ∆2 ≥ 0, ovat polynomin juuret re-aalisia ja diskriminantin ollessa negatiivinen juuret ovat kompleksisia. Huo-mattava erikoistapaus on ∆2 = 0, jolloin juuret ovat reaalisia, mutta myössamoja. Tälläistä tapausta kutsutaan tuplajuureksi, eli u1 = u2 = −b/2.

Esimerkki 4.2. Lasketaan polynomin f(x) = 3x2 − 6x + 1 nollakohdatja diskriminantti. Jaetaan ensin polynomi kolmella saaden uusi polynomig(x) = x2 − 2x+ 1/3, jonka juuret ovat samat kuin alkuperäisen polynominf(x). Nyt juuret polynomille ovat

u1 = −2

2+

√22 − 4/3

2=

√2

3− 1

12

u2 = −2

2−√

22 − 4/3

2= −

√2

3− 1.

Juuret ovat siis reaalisia, mikä nähdään myös diskriminantin arvosta∆2 = 22 − 4/3 = 8/3 > 0.

4.2 Kolmas aste

Tämän kappaleen muotoilu noudattaa pääosin teoksessa[2] noudatettua esi-tystapaa.

Kolmannen asteen polynomi on muotoa f(y) = ay3 + by2 + cy+ d ja siitäjohdettu kolmannen asteen yhtälö on muotoa y3 +by2 +cy+d = 0. Kerroin aon tässä nyt jätetty pois, sillä yksinkertaisesti jakamalla se voidaan supistaayhtälöstä pois. Edelleen sijoittamalla y = x− b/3 yhtälöstä saadaan

(x− b/3)3 + b(x− b/3)2 + c(x− b/3) + d = 0

x3 − 3bx2

3+

3b2x

9− b3

27+ bx2 − 2b2x

3+b3

9+ cx− cb

3+ d = 0

x3 +9c− 3b2

9x+

2b3 − 9bc+ 27d

27= 0,

eli toisen asteen termi supistui pois. Tällöin riittää tarkastella kolmannenasteen yhtälöistä tapausta, jotka ovat muotoa

x3 + qx+ r = 0.

Olkoon nyt u eräs tämän yhtälön juuri. Valitaan nyt sellaiset luvut g ja hjoille pätevät ehdot

1◦ g + h = u

2◦ gh = −q/3.

Valinta on mahdollinen, sillä ratkaistaessa tämä yhtälöpari luvun g suhteensaadaan toisen asteen yhtälö, joka voidaan ratkaista. Sijoittamalla h = u− galempaan yhtälöön saadaan siis g(u− g) = −q/3 eli g2− ug+ q/3 = 0, jotentälläiset luvut g ja h ovat olemassa.

Sijoitetaan nyt u = g + h tarkasteltavaan kolmannen asteen yhtälöön.

(g + h)3 + q(g + h) + r = 0

g3 + 3g2h+ 3gh2 + h3 + q(g + h) + r = 0

g3 + h3 + (g + h)(3gh+ q) + r = 0

13

Tästä muodosta voidaan nyt poistaa termi (g + h)(3gh + q), sillä lukujen gja h valinnan perusteella 3gh+ q = 0. Tällöin

g3 + h3 + r = 0,

johon edelleen sijoittamalla ehdosta 2◦ saatu h = − q3g

päästään muotoon

g3 − q3

27g3+ r = 0

g6 + rg3 − q3

27= 0.

Tämä on nyt toisen asteen yhtälö luvun g3 suhteen. Ratkaisemalla saadaan

g3 = 1/2(−r ±√r2 + 4q3/27).

Koska h3 = −r − g3, niin vastaavasti

h3 = 1/2(−r ∓√r2 + 4q3/27).

Tällöin alkuperäisen kolmannen asteen yhtälön eräs juuri on

u =3

√1/2(−r +

√r2 + 4q3/27) +

3

√1/2(−r −

√r2 + 4q3/27).

Esimerkki 4.3. Ratkaistaan polynomin f(y) = −2y3 + 6y2 − 4y − 2 nolla-kohta.Ensiksi muutetaan polynomi muotoon x3 +qx+r, mihin voidaan käyttää as-ken saatua ratkaisukaavaa. Nyt polynomin −1

2f(y) nollakohta on sama kuin

polynomin f(y), joten tarkastellaan tätä polynomia ja merkitään sitä täh-dellä. Tällöin f ∗(y) = y3 − 3y2 + 2y + 1. Käytetään nyt tähän polynomiinsijoitusta y = x−b/3 = x+1, jolloin saadaan uusi polynomi g(x) = f ∗(x+1),joka on muotoa

g(x) = (x+1)3−3(x+1)2+2(x+1)+1 = x3+3x2+3x+1−3x2−6x−3+2x+2+1

g(x) = x3 − x+ 1

Nyt tähän muotoon voidaan käyttää edellä muodostettua ratkaisukaavaa,jolloin polynomin nollakohta on

u =3

√1/2(−r +

√r2 + 4q3/27) +

3

√1/2(−r −

√r2 + 4q3/27)

u =3

√1/2(−1 +

√−23/27) +

3

√1/2(−1−

√−23/27).

14

Tämän likiarvo voidaan laskea laskimella, jolloin saadaan u ≈ −1, 32. Nyttämä on siis vasta polynomin g(x) nollakohta. Tällöin polynomin f ∗(y) nolla-kohdat ovat polynomin g(x) nollakohdat, joihin on lisätty 1, eli tapaus u+1.Koska alkuperäisen polynomin f(y) nollakohdat ovat samat kuin polynominf ∗(y), on polynomin f(y) yksi nollakohta

y1 = 1 +3

√1/2(−1 +

√−23/27) +

3

√1/2(−1−

√−23/27)

ja sen likiarvo y1 ≈ −0, 32.

Tässä on vasta ratkaistu yksi kaikkiaan kolmesta yhtälön juuresta. Loputkaksi juurta voidaan kuitenkin johtaa tästä ensimmäisestä juuresta. Tarkas-tellaan tätä varten yhtälön x3 − 1 = 0 juuria. Nyt yksi näistä juurista on1, mikä voidaan tarkastaa sijoittamalla se yhtälöön. Jakamalla yhtälö tälläjuurella saadaan toisen asteen yhtälö x2 + x+ 1 = 0, jonka juuret ovat

x = 1/2[−1±√

1− 4] = −1

2± i√

3

2.

Koska näistä juurista toinen saadaan korottamalla toinen sen neliöön, mer-kitään näitä kahta muuta juurta symbolein ω ja ω2. Tällöin

ω = −1

2+ i

√3

2

ω2 = −1

2− i√

3

2.

Näiden termien valinta perustuu niiden ominaisuuksiin. Korottaessa termi ωkolmanteen potenssiin saadaan

ω3 = (−1

2− i√

3

2)(−1

2+ i

√3

2) =

1

4+ i

√3

4−+i

√3

4+

3

4= 1.

Valittaessa termeja g ja h tuli päteä ehdot 1◦ ja 2◦. Ehto 2◦ toteu-tuu myös käyttämällä termien g ja h tilalta termejä ωg ja ω2h tai ω2gja ωh, sillä gh = ω3gh = (ωg)(ω2h) = (ω2g)(ωh). Samoin ehto 1◦ pä-tee, sillä ratkaisussa käytetyt termit g = 3

√g3 = 3

√(ωg)3 = 3

√(ω2g)3 ja

h =3√h3 = 3

√(ωh)3 = 3

√(ω2h)3 voidaan korvata nyt käytetyillä termeillä.

Tästä voidaan siis muodostaa yhtälön kaksi muuta juurta. Merkitään juurianyt termeillä u, v ja w, jolloin vastaavasti

u = g + h

15

v = ωg + ω2h

w = ω2g + ωh.

Otetaan esimerkki, missä ratkaistaan nämä kaikki kolme juurta.

Esimerkki 4.4. Esimerkki teoksesta [3], sivulta 148.Ratkaistaan yhtälön x3 + 3x2 + 9x + 14 = 0 juuret. Jotta voimme käyttääratkaisukaavaamme, tulee yhtälö ensin muuttaa muotoon x3 + qx + r = 0.Tehdään sijoitus x = y − b/3 = y − 1, jolloin saadaan

(y − 1)3 + 3(y − 1)2 + 9(y − 1) + 14 = 0

y3 + 6y + 7 = 0.

Tämä yhtälö on nyt halutussa muodossa, missä q = 6 ja r = 7. Tällöin yksiratkaisu yhtälöön on

u =3

√1/2(−r +

√r2 + 4q3/27) +

3

√1/2(−r −

√r2 + 4q3/27)

u =3

√1/2(−7 +

√49 + 32) +

3

√1/2(−7−

√49 + 32) =

3√

1 + 3√−8 = −1.

Tämä ratkaisu on helppo saada myös kokeilemalla tai yhtälöä tutkimalla.Edellisten tietojen perusteella voidaan nyt myös muodostaa kaksi muutajuurta. Nyt g = 1, h = −2, ω = −1

2+ i

√32

ja ω2 = −12− i

√32, jolloin

yhtälön juuret v ja w ovat

v = ωg + ω2h = −1

2+ i

√3

2+ 1 + i

√3

v =1

2+

3

2

√3i

w = ω2g + ωh = −1

2− i√

3

2+ 1− i

√3

w =1

2− 3

2

√3i.

Nämä ovat siis juuret yhtälöön y3 + 6y + 7 = 0, jolloin alkuperäisen yhtälönx3 + 3x2 + 9x+ 14 = 0 juuret saadaan takaisin sijoittamalla (y − 1 = x):

ux = −1− 1 = −2

vx =1

2+

3

2

√3i− 1 = −1

2+

3

2

√3i

16

wx =1

2− 3

2

√3i− 1 = −1

2− 3

2

√3i.

Nyt kun yhtälön juuret ovat selvillä, voidaan toisen asteen yhtälön tavoinmäärittää sille diskriminantti.

Määritelmä 4.5. Olkoon yhtälön x3 + qx+ r = 0 juuret u, v ja w. Lisäksiolkoon

∆ = (u− v)(u− w)(v − w).

Tällöin termiä ∆2 kutsutaan kolmannen asteen yhtälön diskriminantiksi.

Koska kolmannen asteen yhtälö on hieman haastavampaa käsitellä jaymmärtää, niin osoitetaan kolmannen asteen yhtälön diskriminantin arvolauseen avulla.

Lause 4.6. Olkoon yhtälön x3 + qx+ r = 0 juuret u, v ja w. Tällöin yhtälön

diskrimantti on

∆2 = −27r2 − 4q3.

Todistus. Todistus luentomonisteesta [1] sivulta 27.Määritelmän 4.5 perusteella ∆ = (u − v)(u − w)(v − w). Lasketaan tulontermit erikseen. Siis ensimmäinen termi on

u− v = g + h− ωg − ω2h

= g(1− ω)− ω2h(1− ω)

= (1− ω)(g − ω2h),

toinen termi onu− w = g + h− ω2g − ωh

= g(1− ω2)− ωh(1− ω2)

= (1− ω2)(g − ωh)

= −ω2(1− ω)(g − ωh)

ja kolmas termi on

v − w = ωg + ω2h− ω2g − ωh

= ω[g + ωh− ωg − h]

= ω(1− ω)(g − h).

17

Yhdistämällä nämä, saadaan

∆ = (1− ω)(g − ω2h)(−ω2(1− ω)(g − ωh))(ω(1− ω)(g − h))

= −ω3(1− ω)3(g − h)(g − ωh)(g − ω2h)

= −(1− 3ω + 3ω2 − ω3)(g − h)(g − ωh)(g − ω2h)

= −[1− 3(−1

2− i√

3

2) + 3(−1

2+ i

√3

2)− 1](g − h)(g − ωh)(g − ω2h)

= 3√

3i(g − h)(g − ωh)(g − ω2h).

Nyt termin ω ominaisuuksien vuoksi g3 − h3 = (g − h)(g − ωh)(g − ω2h).Tämä voidaan myös ajatella kolmannen asteen yhtälönä luvun g suhteen,jolla on juuret g1 = h, g2 = ωh ja g3 = ω3h. Tästä seuraa

∆ = 3√

3i(g3 − h3)

∆ = 3√

3i

√r2 +

4q3

27,

jolloin edelleen∆2 = −27r2 − q3.

Kuten toisen asteen tapauksessa, diskriminantin arvo on yhteydessä juu-rien arvoihin. Kolmannen asteen yhtälö kuitenkin poikkeaa toisesta asteesta;kolmannen asteen yhtälöllä on aina vähintään yksi reaalinen juuri, riippu-matta diskriminantin arvosta. Osoitetaan kolmannen asteen yhtälön diskri-minantin arvoon liittyvä lause:

Lause 4.7. Polynomin x3 + qx + r kaikki nollakohdat ovat reaalisia, jos ja

vain jos diskriminantti on positiivinen eli ∆2 ≥ 0.

Todistus. Todistus luentomonisteesta [1] sivulta 27.Mikäli kaikki juuret u, v ja w ovat reaalisia, niin silloin ∆ = (u−v)(u−w)(v−w) on reaalinen ja siten myös ∆2 ≥ 0. Tarkastellaan siis tapausta, missä jokinjuurista ei ole reaalinen. Olkoon yhtälön juuri w muotoa w = s + ti, missät, s ∈ R ja t 6= 0. Tällöin toinen juurista on muotoa v = s−ti ja kolmas juuri uon reaalinen, sillä kuten aiemmin todettiin, on kolmannen asteen polynomillaaina vähiintään yksi reaalinen juuri. Lasketaan nyt diskriminantin arvo.

∆ = (u− v)(u− w)(v − w) = [u− (s− ti)][u− (s+ ti)](−2ti)

∆ = [(u− s) + ti][(u− s)− ti](−2ti) = [(u− s)2 − (ti)2](−2ti),

18

jolloin saadaan∆2 = [(u− s)2 + t2]2(−2ti)2.

Nyt nähdään, että kaikki neliötermit viimeistä lukuunottamatta ovat posi-tiivisia, sillä ne sisältävät vain reaalisia lukuja. Viimeinen termi on kuitenkinnegatiivinen, sillä i2 = −1. Tällöin siis ∆2 ≤ 0.

Kuten toisen asteen yhtälöissä, on kolmannen asteen yhtälöissä diskrimi-nantin arvo ∆2 = 0 poikkeuksellinen. Tällöin polynomilla on moninkertainennollakohta. Tämä ei kuitenkaan kerro, onko nollakohta kaksin- vai kolmin-kertainen, kuten seuraava esimerkki näyttää.

Esimerkki 4.8. Polynomin f(x) = (x − 1)(x − 1)(x + 2) = x3 − 3x + 2diskriminantti on ∆2 = −27 ·22−4 · (−3)3 = 0. Tulomuodosta nähdään, ettänollakohta x = 1 on kaksinkertainen.Polynomin g(x) = (x − 0)(x − 0)(x − 0) = x3 diskriminantti on myös ∆2 =−27 · 02 − 4 · 03 = 0. Tulomuodosta nähdään, että nollakohta x = 0 onkolminkertainen.

4.3 Neljäs aste

Tässä kappaleessa mukaillaan pääasiassa teoksen [2] esitystapaa.Neljännen asteen polynomi on muotoa f(y) = ay4 + by3 + cy2 + dy+ e ja

siitä johdettu neljännen asteen yhtälö on muotoa y4 + by3 + cy2 +dy+ e = 0.Kerroin a on tässä nyt jätetty pois, sillä yksinkertaisesti jakamalla se voidaansupistaa yhtälöstä pois. Edelleen sijoittamalla y = x− b/4 yhtälöstä saadaan

(x− b/4)4 + b(x− b/4)3 + c(x− b/4)2 + d(x− b/4) + e = 0

x4−bx3+3b2x2

8−b

3x

16+b4

256+bx3−3b2x2

4+

3b3x

16− b

4

64+cx2−bcx

2+b2c

16+dx−bd

4+e = 0

x4 +8c− 3b2

8x2 +

3b2 − b3 − 8bc+ 16d

16x+

16b2c− 3b4 − 64bd+ 256e

256= 0,

eli kolmannen asteen termi supistui pois. Tällöin riittää tarkastella neljännenasteen yhtälöistä tapausta, jotka ovat muotoa

x4 + qx2 + rx+ s = 0.

Pyritään jakamaan tämä vaillinnainen neljännen asteen polynomi tekijöihin.Merkitään

x4 + qx2 + rx+ s = (x2 + jx+ l)(x2 + jx+m)

19

= x4 + (m+ l − j2)x2 + (jm− jl)x+ml,

jolloin vertaamalla termejä saadaan yhtälöryhmäm+ l − j2 = q

jm− jl = r

ml = s,

(1)

josta termit m, l ja j on mahdollista ratkaista annettujen termien q, r ja ssuhteen. Ratkaistaan kahdesta ylemmästä yhtälöstä termi m, jotka yhteen-laskemalla saadaan:

m = q − l + j2

m = l + r/j

2m = q + j2 + r/j

(2)

Vastaavasti myös muuttujan l suhteen:l = q −m+ j2

l = m− r/j2l = q + j2 − r/j

(3)

Sijoittamalla tämän nyt yhtälöryhmän alimpaan yhtälöön saadaan

s = ml

4s = 2m2l

4s = (q + j2)2 − (r/j)2

q2 + 2qj2 + j4 − 4s− r2

j2= 0

j6 + 2qj4 + (q2 − 4s)j2 − r2 = 0.

Tämän kolmannen asteen yhtälön ratkaisuna saadaan selville j2 ja sitä kaut-ta j sekä yhtälöryhmän muuttujat m ja l. Tämän jälkeen yhtälön ratkaisuuntarvitsee ratkaista vain toisen asteen yhtälöt x2+jx+l = 0 ja x2−jx+m = 0.

Koska kolmannenkin asteen yhtälön ratkaisu on pitkä, tulisi neljännenasteen yhtälön ratkaisusta vielä moninkerroin pidempi. Tämän vuoksi yhtä-lön eksplisiittistä ratkaisua ei esitetä. Näytetään kuitenkin esimerkillä, mitenratkaisu saataisiin tehtyä.

20

Esimerkki 4.9. Esimerkki teoksesta [2], sivulta 358.Tarkastellaan yhtälöä x4 − 2x2 + 8x− 3 = 0, missä kolmannen asteen termion jo hävitetty yhtälöstä. Jaetaan tämä yhtälö nyt kahteen toisen asteentermiin, kuten aiemmin, jolloin saadaan

x4 − 2x2 + 8x− 3 = (x2 + jx+ l)(x2 + jx+m)

= x4 + (m+ l − j2)x2 + (jm− jl)x+ml,

mistä voidaan muodostaa yhtälöryhmä. Se on nyt muotoam+ l − j2 = −2

jm− jl = 8

ml = −3,

mistä edelleen voidaan muodostaa, kuten aiemmin, kolmannen asteen yhtälömuuttujan j2 suhteen.

j6 + 2qj4 + (q2 − 4s)j2 − r2 = 0

j6 − 4j4 + 16j2 − 64 = 0

Nyt voitaisiin ensin poistaa toisen asteen termi suorittamalla muuttujan vaih-to j2 = y + 4/3, jolloin yhtälö olisi muotoa

y3 +32

3y − 1280

27

ja josta edelleen saataisiin, diskriminantin ∆2 = −27r2 − 4q3 = −65536ollessa negatiivinen, saadaan ainoaksi reaalijuureksi

u = 3

√√√√1/2

(1280

27+

√12802

272− 4 · 323

27 · 33

)+ 3

√√√√1/2

(1280

27−√

12802

272− 4 · 323

27 · 33

)

u = 8/3,

joka takaisinvaihdon kautta antaa tulokseksi j2 = 8/3 + 4/3 = 4. Tämävastaus saadaan kuitenkin ehkä helpommin kokeilemalla.

Nyt sijoittamalla tämä arvo yhtälöryhmään saadaan yhtälöpari{m+ l − 4 = −2

ml = −3,

mistä edelleen muodostuu toisen asteen yhtälö l2−2l−3 = 0, josta l = 1±2.Valitsemalla l = 3 seuraa, että m = −1, kun taas toisinpäin tehty valinta

21

tuottaa päinvastaisen tuloksen. Valinnasta riippuen j on joko positiivinentai negatiivinen. Valinta l = 3 tekee yhtälöryhmän keskimmäisen yhtälönperusteella muuttujasta j negatiivisen, jolloin

m = −1

l = 3

j = −2.

Tällöin alkuperäinen yhtälö saa muodon

x4 − 2x2 + 8x− 3 = (x2 − 2x+ 3)(x2 + 2x− 1) = 0,

mistä toisen asteen yhtälöt voidaan ratkaista helposti.Yhtälöstä x2−2x+3 = 0 saadaan ratkaisuiksi x1 = 1+

√2i ja x2 = 1−

√2i ja

yhtälöstä x2+2x−1 = 0 saadaan ratkaisuiksi x3 = −1+√

2 ja x4 = −1−√

2.Nämä neljä juurta ovat siis alkuperäisen yhtälön neljä nollakohtaa.

Myös neljännen asteen yhtälölle on mahdollista määrittää diskriminantti,mutta koska emme määrittäneet eksplisiittistä ratkaisua neljännen asteenyhtälölle, jätämme myös diskriminantin määrityksen pois.

4.4 Trigonometriaan perustuva ratkaisu

Tämä kappaleen mukailee teoksen [2] esitystapaa.Kolmannen asteen yhtälön juuret ovat joskus hyvin hankalia, jos ne rat-

kaistaan klassisella ratkaisukaavalla. Seuraava on tästä hyvä esimerkki.

Esimerkki 4.10. Esimerkki teoksesta [2], sivulta 355.Ratkaistaan yhtälö x3 − 7x + 6 = 0 ratkaisukaavalla. Nyt q = −7 ja r = 6,mistä edelleen

g3 = 1/2(−r+√r2 + 4q3/27) = 1/2(−6+

√36− 1372/27) = −3+

√−100/27

h3 = 1/2(−r −√r2 + 4q3/27) = −3−

√−100/27)

jolloin ratkaisut ovat

u = g + h =3

√−3 +

√−100/27 +

3

√−3−

√−100/27.

v = ωg+ω2h = (−1

2+i

√3

2)

3

√−3 +

√−100/27+(−1

2−i√

3

2)

3

√−3−

√−100/27

22

w = ω2g+ωh = (−1

2−i√

3

2)

3

√−3 +

√−100/27+(−1

2+i

√3

2)

3

√−3−

√−100/27

Nämä ratkaisut ovat hyvin monimutkaisen näköisiä, mutta todellisuudessane ovat kokonaislukuja. Tämä johtuu siitä, että yhtälö voidaan kirjoittaa sentulomuodossa seuraavasti:

x3 − 7x+ 6 = (x− 1)(x− 2)(x+ 3) = 0

Tällöin juuret u, v ja w vastaavat lukuja 1, 2 ja −3, ei tosin välttämättätässä järjestyksessä.

Yksi tapa kiertää tälläiset hankalat kompleksiluvut on käyttää trigono-metrista lähestymistapaa. Mikäli kolmannen asteen yhtälön kaikki juuret ovatreaalisia, voidaan juurien arvoa approksimoida lauseen 4.12 avulla. Todiste-taan tätä lausetta varten ensin seuraava lemma. Trigonometriset lauseet ote-taan todistamatta käyttöön.

Lemma 4.11. Olkoon kolmannen asteen polynomi f(y) = y3 − 3/4y −1/4cos(3θ). Tämän polynomin juuret ovat cosθ, cos(θ+120◦) ja cos(θ+240◦).

Todistus. Tiedetään, että

cos(3θ) = 4cos3θ − 3cosθ. (4)

Tästä seuraa suoraan, että yksi polynomin juurista on cosθ, sillä sijoitusy = cosθ tuottaa yhtälön cos3θ−3/4cosθ−1/4cos(3θ) = 0 joka on yhtäpitäväyhtälön 4 kanssa. Koska

cos(3θ) = cos(3θ + 360◦) = cos(3(θ + 120◦)) = cos(3(θ + 240◦)),

niin myös cos(θ + 120◦) ja cos(θ + 240◦) kelpaavat juuriksi.

Nyt voidaan muotoilla trigonometriset juuret antava lause.

Lause 4.12. Olkoon f(x) = x3 + qx + r kolmannen asteen polynomi, jonka

kaikki juuret ovat reaalisia, eli 27r2 + 4q3 ≤ 0. Mikäli t =√−4q/3 ja

cos3θ = −4r/t3, niin yhtälön juuret ovat tcosθ, tcos(θ + 120◦) ja tcos(θ +240◦).

Todistus. Olkoon v eräs polynomin f(x) juurista. Jos merkitään v = tu, niinvoidaan annettu polynomi muuttaa yhtälöksi

u3 +q

t2u+

r

t3= 0.

23

Jos nyt voimme valita muuttujan t siten, että

q

t2= −3

4

jar

t3= −1

4cos(3θ)

jollakin θ arvolla, niin silloin Lemman 4.11 nojalla yhtälön juuret ovat cosθ,cos(θ + 120◦) ja cos(θ + 240◦). Lisäksi, koska v = tu, on alkuperäisen poly-nomin juuret silloin v = tcosθ, tcos(θ + 120◦) ja tcos(θ + 240◦).Ensimmäisestä muuttujan t ehdosta seuraa nyt

t =

√−4q

3.

Tämä luku on nyt reaaliluku, sillä oletuksen ehdosta 27r2 + 4q3 ≤ 0 seuraase, että q ≤ 0 ja −4q

3≥ 0.

Toinen muuttujan t ehto muokkautuu muotoon

−4r

t3= cos(3θ),

mikä on määritelty vain ja ainoastaan, kun | − 4r/t3| ≤ 1. Osoitetaan sesiis todeksi. Oletuksesta saadaan 27r2 ≤ −4q3 eli 9r2/q2 ≤ −4q/3. Tästäedelleen voidaan johtaa ∣∣∣∣3rq

∣∣∣∣ ≤√−4q

3= t,

koska t2 = −4q/3 ja t =√−4q/3. Tällöin∣∣∣∣−4r

t3

∣∣∣∣ =

∣∣∣∣ −4r

(−4q/3)t

∣∣∣∣ =

∣∣∣∣3rqt∣∣∣∣ ≤ t

t= 1,

kuten pyrittiinkin osoittamaan. Nyt siis on löydetty sellainen t joka muuttaayhtälön muotoon, jonka juuret saadaan Lemman 4.11 nojalla.

Kokeillaan tätä lausetta nyt esimerkkiin 4.10.

Esimerkki 4.13. Esimerkki teoksesta [2], sivuilta 360 ja 361.Ratkaistaan kolmannen asteen yhtälön x3 − 7x+ 6 = 0 juuret trigonometri-sesti. Lasketaan ensin t ja θ, käyttäen likiarvoja. Nyt

t =√−4q/3 =

√28/3 ≈ 3, 055

24

ja tätä likiarvoa hyväksikäyttäen voimme laskea likiarvon cos(3θ)

cos(3θ) = −4r

t3≈ − 24

3, 0553≈ −0, 842,

mistä edelleen voimme laskea likiarvon muuttujalle θ

3θ ≈ 148◦

θ ≈ 49◦.

Koska tiedämme esimerkistä 4.10 yhtälön juurien olevan reaalisia, voimmelauseen 4.12 perusteella ilmoittaa juurien likiarvot.

u ≈ 3, 055cos49◦ ≈ 2, 00

v ≈ 3, 055cos169◦ ≈ −3, 00

w ≈ 3, 055cos289◦ ≈ 1, 00

Trigonometrinen approksimointi on siis huomattavan näppärä tapa sel-vittää juurien arvot verrattuna klassiseen ratkaisukaavaan.

4.5 Viides aste

Tämä kappale noudattaa luentomonisteen ja luentomuistiinpanojen [1] esi-tystapaa.Viidennen asteen yhtälö voidaan merkitä tutussa muodossa ax5 +bx4 +cx3 +dx2+ex+f = 0. Tästä muodosta voidaan jälleen poistaa jakamalla kerroin aja sitten toiseksi korkeinta astetta oleva termi sijoituksella x = y−b/5, jolloinyhtälö saadaan muotoon x5+px3+qx2+rx+s = 0. Edellisten ratkaisukaavo-jen muodostamisen perusteella voisi olettaa, että ratkaisu löytyy nyt jollakinovelalla sijoittamisella tai yhtälön pyörittelyllä, mutta todellisuudessa näinei voida tehdä. Viidennen asteen yhtälölle ei ole olemassa klassista ratkai-sukaavaa. Myöskään korkeammille kuin viidennen asteen yhtälöille ei yleisiäratkaisukaavoja ole olemassa. Tämän pätevä perusteleminen vaatii Galois'nteoriaa, mitä tähän tutkielmaan ei ole tarkoitus sisällyttää. Todettakoon asiakuitenkin lyhyesti.

Klassinen ratkaisukaava polynomille on mahdollista tuottaa, jos polyno-mi f(x) on juuriratkeava. Tätä varten täytyy olla mahdollista tehdä polyno-min f(x) Galois'n ryhmälle aliryhmien ketju, jossa peräkkäisten aliryhmientekijäryhmä on aina syklinen. Jaottomilla viidennen asteen polynomeilla syn-tyy tekijäryhmä A5/(1), mikä ei alternoivien ryhmien teorian perusteella olesyklinen. Tämän takia polynomi f(x) ei ole juuriratkeava, eikä näin ollen vii-dennen asteen yhtälöille ole mahdollista muodostaa klassista ratkaisukaavaa.

25

Esimerkki 4.14. Polynomi f(x) = x5−6x+3 on Eisensteinin kriteerin (lause3.5) nojalla jaoton, sillä alkuluku p = 3 jakaa luvun 6 ja 3, muttei lukua 1ja lisäksi p2 = 9 - 3. Osoittautuu, että polynomin f(x) Galois'n ryhmä onsymmetrinen ryhmä S5. Tämän vuoksi polynomi f(x) ei ole juuriratkeava.

Kolmannen ja neljännen asteen polynomeilla tälläinen Galois'n ryhmällemuodostuva aliryhmien ketju, jonka tekijäryhmät ovat syklisiä on mahdollis-ta muodostaa, siksi kolmannen ja neljännen asteen polynomeille oli mahdol-lista muodostaa ratkaisukaava.

5 Yhtälöiden historiaa

Tämä kappale etenee teoksen [4] mukaisesti.

5.1 Ensimmäinen ja toinen aste

Yhtälöiden ratkaisemisella on pitkä historia. Ensimmäisen asteen yhtälöitäon ratkottu jo ainakin muinaisessa Egyptissä, 5000 vuotta sitten. Kyseisetyhtälöt ovat yleisesti olleet typpiä x + ax = b tai x + ax + bx = c. Tälläi-siin tehtäviin on aina liittynyt jokin käytännön ongelma tai sanallinen selitys.Esimerkiksi yhtälö x + 1

7x = 19 on sanallisesti esitetty 'Mikä on kasan arvo,

jos kasa ja sen seitsemäsosa on 19'. Ratkaisua on haettu ensin väärällä ar-volla arvaamalla, jonka jälkeen yhtälön vasenta puolta on verrattu yhtälönoikeaan puoleen. Tämän jälkeen vasenta puolta on kerrottu sopivalla luvullajotta päästään haluttuun arvoon, jolloin myös arvausta on kerrottu samal-la luvulla, saaden näin oikea vastaus. Myös toisen asteen yhtälöitä voidaanegyptiläisten ajatella ratkaisseen, tosin vain vaillinnaisia sellaisia. Tehtävätolivat geometrisia, yleensä neliöiden ja ympyröiden pinta-alojen laskemistamissä esiintyi neliötermejä.

Seuraava suuri edistysaskel algebrassa ja yhtälöiden ratkaisemisessa si-joittuu Babyloniaan, aikakaudelle 2000-600 eKr. Babylonialaiset olivat ni-mittäin onnistuneet selvittämään toisen asteen yhtälön ratkaisukaavan. Ba-bylonialaisten tapa lähestyä algebraa, kuten egyptiläistenkin, oli puhtaankäytännöllinen. Vastaukset ongelmiin katsottiin taulukoista, joihin oli ennal-ta laskettu tulokset eri muuttujan arvoilla. Mikäli vastaus oli taulukon ar-vojen välistä, käytettiin interpolointia. Myös likiarvot olivat babylonialaistensuosiossa, sillä toisin kuin egyptiläisillä, heidän 60-paikkajärjestelmänsä sallimyös desimaalien käytön.

Koska Babyloniassa, kuten ei vielä pitkään aikaan yleisestikkään, hyväk-sytty negatiivisia lukuja, olivat toisen asteen yhtälöt jotakin seuraavista kol-

26

mesta muodosta (lukujen p ja q ollessa positiivisia):

x2 + px = q

x2 = px+ q

x2 + q = px

Babylonialaiset olivat kehittäneet näille yhtälöille ratkaisukaavan. Meidänmerkintätavallamme ratkaisu on x =

√(p/2)2 + q + p/2, joka vastaa edelli-

sistä yhtälöistä keskimmäistä tapausta. Babylonialaiset olivat myös taitaviayhtälöiden pyörittäjiä. Sellaiset tapaukset kuten 11x2 + 7x = a eivät tuotta-neet ongelmia, vaan niistä selvittiin hämmästyksellisesti muuttujan vaihdonavulla. Yhtälö ensin kerrottiin toisen asteen termin kertoimella, jonka jälkeentermi 11x korvattiin muuttujalla y, joka ratkaistiin.

(11x)2 + 7 · 11x = 11a⇔ y2 + 7y = 11a

Tämän jälkeen alkuperäinen x voitiin ratkaista yhtälöstä 11x = y.Babylonialaiset osasivat myös ratkoa vaillinnaisia kolmannen asteen yh-

tälöitä. Yhtälöihin x3 = a ja x3 + x2 = a voitiin katsoa ratkaisut valmiistataulukoista. Kuten aiemmin todettiin, eivät termien kertoimet olleet ongel-mallisia, vaan niistä päästiin sijoitusmenetelmällä eroon. Vaikkakin babylo-nialaiset osasivat käyttää sijoitusmenetelmäänsä hyvin, ei ole varmuutta sii-tä, että he olisivat osanneet hyödyntää sitä täydelliseen kolmannen asteenyhtälöön. Periaatteessa ei ole vaikeaa sijoittaa sopivaa termiä nelitermiseenyhtälöön muodostaen siitä kolmitermisen, jonka he selvästi osasivat ratkais-ta. Sijoitusmenetelmää osattiin kuitenkin soveltaa myös esimerkiksi yhtälöönx8 + px4 = q, muuttaen se toisen asteen yhtälöksi sijoituksella y = x4. Täl-läinen korkeampien asteiden yhtälöiden ratkaiseminen, millä ei ollut tuohonaikaan mitään käytännön sovellutusta, kertoo korkeasta matematiikan osaa-misesta ja kiinnostuksesta.

5.2 Kolmas ja nejäs aste

Yhtälöiden ratkaisemisen taito pysyi tällä tasolla pitkään. Vasta 1500-luvullaotettiin seuraava edistysaskel, nimittäin kolmannen asteen yhtälön ratkai-sukaavan löytyminen. Tämän ratkaisun esitti julkisesti ensimmäisen kerranitalialainen Geronimo Cardano (1501-1576) teoksessaan Ars Magna vuon-na 1545, yhdessä neljännen asteen yhtälön ratkaisukaavan kanssa. Cardanoei itse keksinyt näitä ratkaisuja, kuten hän itsekkin teoksessaan ilmoittaa,vaikkakin kolmannen asteen yhtälön ratkaisu

u =3

√1/2(−r +

√r2 + 4q3/27) +

3

√1/2(−r −

√r2 + 4q3/27).

27

tunnetaan nykyäänkin nimellä Cardanon kaava. Kappaleissa 4.2 ja 4.3 esite-tyt ratkaisut mukailevat tuon ajan ratkaisutapaa löyhästi.

Kolmannen asteen yhtälön ratkaisukaavan uskotaan löytäneen ensimmäi-senä Scipione del Ferro (1465-1526), joka toimi Bolognan yliopiston matema-tiikan professorina. Hän ei julkaissut ratkaisuaan, mutta paljasti sen eräälleoppilaistaan, Antonio Maria Fiorille, ennen kuolemaansa. Sana kiiri kolman-nen asteen yhtälön ratkaisemisesta, mikä innoitti myös Niccolo Tartagliaa(1500-1557) ratkaisun löytämiseen. Hän saikin, ei välttämättä täysin ominavuin, mutta kuitenkin sai muodostettua itsekin ratkaisun. Myös tästä alkoisana leviämään, mikä innoitti Fiorin ja Tartaglian kisaamaan aiheesta. Hemuodostivat toisilleen kolmannen asteen yhtälöitä ratkaistaviksi, mitkä hei-dän tuli tietyssä ajassa ratkaista. Tartaglia voitti kisan ylivoimaisesti, joh-tuen hänen erilaisesta ratkaisukaavastaan. Fior osasi ratkaista vain muotoax3 + qx = r olevat yhtälöt, kun taas Tartaglia hallitsi myös yhtälöt, jotkaolivat muodossa x3 + qx2 = r. Mahdollisesti Tartaglia osasi muuttaa kap-paleessa 4.2 olevan esityksen tavoin yhtälön muotoon, missä toisen asteentermiä ei ole. Cardanon kuultua Tartaglian menestyksestä, hän kutsui hä-net luokseen. Cardano oli menestyvä lääkäri, joka oli taitava usealla tieteenalalla, kun taas Tartaglia oli, lapsena saadun vamman vuoksi, puhevikainenja heikommassa sosiaalisessa asemassa. Erinäisten lupausten saattelemanaCardano sai kolmannen asteen yhtälön ratkaisun Tartaglialta, minkä Tar-taglia aikoi myöhemmin sisällyttää algebralliseen tutkimukseensa. Cardanokuitenkin rikkoi lupauksensa ja julkaisi ratkaisun ennen Tartagliaa.

Neljännen asteen yhtälön ratkaisun Cardano sai apulaiseltaan LudovicoFerrarilta (1522-1565). Ars Magnassa hän kertoo Ferrarin keksineen sen hä-nen pyynnöstään. Näillä ratkaisuilla oli suuri merkitys matematiikkaan. Neolivat uutta edistystä tuhansia vuosia askarruttaneiden asioiden parissa. Eri-tyisesti neljännen asteen yhtälöllä ei ollut enää käytännön sovellutusta kol-miulotteisessa maailmassamme, joten siksi tätä kutsutaankin nykyaikaisenmatematiikan aluksi. Tästä alkanut algebran tutkimisen kiihko toikin pal-jon uutta matematiikkaa. Esimerkin 4.10 antamat ratkaisut ovat tästä hyväesimerkki. Cardano ei voinut ymmärtää, miten aikasemmin epätodellisinahylätyt tapaukset neliöjuuren sisällä olevista negatiivisista luvuista saattoi-vatkin tuotaa kokonaislukuja. Negatiivisten lukujen ja imaginäärilukujen ke-hitys pääsi etenemään tällaisen huomion kautta.

5.3 Viides aste ja Galois'n teoria

Luonnollisesti useat matemaatikot yrittivät tästä innottuneina löytää viiden-nen asteen yhtälön ratkaisukaavaa, turhaan. Kuten totesimme, viidennen as-teen yhtälöille ei ratkaisukaavaa ole olemassa. Tämän todisti ensimmäisenä

28

riittävän tarkasti Niels Abel vuonna 1824, yrittäessään ratkaista viidennenasteen yhtälöä. Myös aikaisempi todistus tästä löytyy vuodelta 1799, joka oliPaolo Ru�nin käsialaa, mutta mitä ei kelpuutettu riittäväksi todistukseksi.Tästä löydöstä innostuneena Évariste Galois (1812-1832) intoutui tutkimaanabstraktia algebraa. Useat vastoinkäymiset kuitenkin varjostivat Galois'n elä-mää; hänen opiskeluhakemuksensa hylättiin toistuvasti, hänen julkaistaviksitarkoitetut tutkimukset joko hävisivät tai ne palautettiin julkaisukelvottomi-na, hänen isänsä teki itsemurhan ja hän joutui viettämään useita kuukausiavankilassa. Vuonna 1832 hänet haastettiin kaksintaisteluun, joka johti hänenkuolemaansa, Galois'n ollessa vasta kahdenkymmenen vuoden iässä. Hänentutkimuksensa olivat, yhdessä muiden matematikkojen kanssa, hyvin mer-kittäviä 1800-luvun algebran kehitykselle. Galois'n mukaan nimetty teoriapystyikin todistamaan yleisesti ratkeavuuden ja sitä kautta ratkaisukaavanolemassaolon, yhtälön asteesta riippumatta. Hänen teoriat saivatkin ansait-semansa arvostuksensa vasta kauan hänen kuolemansa jälkeen; ensimmäinenhänen työstämänsä teoria julkaistiinkin vasta 1846.

29

Lähdeluettelo

[1] J. Kauppi (toim.): Algebra II. Oulu: Oulun yliopiston Matemaattistentieteiden laitoksen julkaisuja, 2008.

[2] J. J. Rotman: A First Course In Abstract Algebra, second edition. UpperSaddle River, New Jersey, USA: Prentice Hall, 2000.

[3] O. E. Nicodemi, M. E. Sutherland, G. W. Towsley: An Introduction

To Abstract Algebra With Notes To The Future Teacher. Upper SaddleRiver, New Jersey, USA: Prentice Hall, 2007.

[4] C. B. Boyer: A History Of Mathematics. Princeton, New Jersey, USA:Princeton University Press, 1985.

30

yhtälöiden ratkaisemisestajultika.oulu.fi/files/nbnfioulu-201501171028.pdff(x) = ( 1)f(x), on...

Documents