maros alexandra - eötvös loránd university...1. fejezet algebrai összefoglaló ebben a...

62

Upload: others

Post on 05-Mar-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

Eötvös Loránd Tudományegyetem

Természettudományi Kar

Maros Alexandra

Perron�Frobenius tételkör ésalkalmazásai

Matematika BSc szakdolgozat

Témavezet®:

Kunszenti-Kovács Dávid

Alkalmazott Analízis és Számításmatematikai Tanszék

Budapest, 2016

Page 2: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

Köszönetnyilvánítás

Ezúton szeretném megköszönni témavezet®mnek, Kunszenti-KovácsDávidnak, hogy elvállalta a konzulensi teend®ket, mindig a rendelkezésemreállt, és hogy mindig segít®készen elmagyarázta a témához kapcsolódófogalmakat és tételeket, hogy azok szemléletes jelentését is megértsem.

Külön köszönöm Édesanyámnak és Édesapámnak, hogy végigolvasták aszakdolgozatomat, és észrevételeikkel, valamint tanácsaikkal hozzájárultak,hogy a dolgozat végs® formája a lehet® legjobb legyen.

Szeretnék továbbá köszönetet mondani barátaimnak, akik mindigmellettem álltak és támogattak a dolgozat írásakor. Külön köszönetteltartozom barátn®mnek, Borbély Zsó�ának, aki végig nyomon követte aszakdolgozat alakulását, minden egyes verziót végigolvasott, és az esetlegeshibákra felhívta a �gyelmemet.

Budapest, 2016. május 27.

Maros Alexandra

2

Page 3: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

Tartalomjegyzék

Bevezetés 5

1. Algebrai összefoglaló 7

2. Perron�Frobenius tétel pozitív mátrixokra 10

2.1. A Collatz-Wielandt formula másik alakja . . . . . . . . . . . . 20

2.2. Jobb és bal oldali Perron vektor . . . . . . . . . . . . . . . . . 21

2.3. A pozitivitás szükségessége . . . . . . . . . . . . . . . . . . . . 24

3. Általánosítás nemnegatív mátrixokra 26

4. Alkalmazások 32

4.1. Primitív mátrixok . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.2. Leontief-féle input-output modell . . . . . . . . . . . . . . . . 34

4.3. Leslie-modell . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.4. Markov-láncok . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

5. Google PageRank 47

5.1. A weboldalak reprezentációja . . . . . . . . . . . . . . . . . . 47

5.2. Matematikai felépítés . . . . . . . . . . . . . . . . . . . . . . . 48

5.2.1. A feladat mátrix reprezentációja . . . . . . . . . . . . . 49

5.3. Az iteráció problémái . . . . . . . . . . . . . . . . . . . . . . . 50

5.4. Kapcsolat a Markov-láncokkal . . . . . . . . . . . . . . . . . . 51

5.5. A Google mátrix felépítése . . . . . . . . . . . . . . . . . . . . 51

3

Page 4: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

TARTALOMJEGYZÉK

5.5.1. A mátrix tulajdonságai . . . . . . . . . . . . . . . . . . 53

5.6. A PageRank vektor kiszámítása . . . . . . . . . . . . . . . . . 54

6. Általánosítás végtelen dimenzióban 57

Irodalomjegyzék 59

4

Page 5: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

Bevezetés

A Perron�Frobenius tételkör egy olyan témakör, amely adotttulajdonságú mátrixok sajátértékeir®l mond ki bizonyos állításokat. Bára tétel alapvet®en a lineáris algebra témakörébe tartozik, számos egyébterületen is fontos szerepet tölt be. Dolgozatom célja, hogy részletesenismertessem a tételt, és hogy bemutassam alkalmazásait több, egymástóleltér® területen.

Az els® három fejezetben ismertetem a tételhez kapcsolódó alapvet®fogalmakat, a tétel eredeti verzióját, amelyet Perron dolgozott ki, illetvea kiterjesztett változatot, amely Frobenius nevéhez f¶z®dik. Ezeket afejezeteket alapvet®en az [1] illetve a [2] irodalom alapján dolgoztam ki. Atovábbi megértéshez elolvastam még a [3], [4], [5], [6] forrásokat, de ezeketvégül közvetlenül nem használtam fel a szakdolgozatomban.

A tétellel viszonylag részletesen foglalkozik egy korábbi szakdolgozat[7], azonban ott csak a nemnegatív mátrixok szemszögéb®l kerül el® a tétel.Ezzel ellentétben én a tételt vizsgáltam általánosan, de mivel ez a korábbidolgozat is ismerteti a tétel egy alkalmazását (versenyz®k rangsorolása), ígyazt én nem fejtettem ki a dolgozatomban.

A negyedik fejezetben szerepel a Perron�Frobenius tételkörnek négykülönböz® alkalmazása. Ezekkel azt próbáltam szemléltetni, hogy milyensokféle területen lehet alkalmazni ezt a tételt, ráadásul olyan problémákmegoldására, amelyek els® ránézésre nem kapcsolódnak közvetlenül hozzá.Ezt a fejezetet az [1] irodalom alapján dolgoztam ki, de a fogalmakrészletesebb megértéséhez elolvastam még néhány további forrást: a primitívmátrixok fejezetéhez a [8] irodalmat, a Leontief-féle input-output modellheza [9], a Leslie-modellhez a [10], illetve a Markov-láncok fejezetéhez a [11]forrásanyagot, valamint egy másik korábbi szakdolgozatot [12].

Az ötödik fejezetben bemutatom, hogy hogyan m¶ködik a Google keres®algoritmusa, és hogy ebben is milyen fontos szerepet tölt be a Perron-�Frobenius tétel. Ennek a fejezetnek a kidolgozásához a [13] irodalmathasználtam fel.

5

Page 6: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

BEVEZETÉS

Az utolsó fejezet egy rövid kitekintést nyújt a tétel végtelen dimenziósáltalánosítására. Ez azért lényeges, mert a megel®z® fejezetekben csakvéges dimenziós esetekr®l olvashatunk, azonban a tétel végtelen dimenziósáltalánosítása fontos szerepet tölt be a parciális di�erenciálegyenletektémakörében. Ezt a fejezetet a [14] irodalom alapján dolgoztam ki, de ittsok segítséget kaptam a témavezet®mt®l is, hogy megértsem a témáhozkapcsolódó fogalmak jelentését. Ebben a fejezetben számos gondolatot az® magyarázatai alapján fejtettem ki. Err®l a témakörr®l részletesebben a [15]irodalomban olvashatunk.

A szakdolgozatom írásakor az eredeti szakirodalmakban szerepl®bizonyításokat sokszor kiegészítettem önálló magyarázatokkal, azért, hogyérthet®bb legyen a bizonyítások menete. A dolgozatban szerepl® ábrákatönállóan hoztam létre a LATEX programban. A fejezetekben említettpéldákat a megjelölt források alapján önállóan dolgoztam ki úgy, hogy azeredeti példákat részben módosítottam. Erre azért volt szükség, hogy lássam,hogy ha apró módosításokat végzek, hogyan változik az adott modell. Azehhez szükséges számításokat pedig MATLAB programmal végeztem el.

Összességében úgy gondolom, hogy a Perron�Frobenius tételkör egynagyon érdekes téma, amelyet tulajdonképpen az emberek nap mintnap használnak. Például ennek a tételnek köszönhetjük, hogy amikoraz interneten rákeresünk egy adott kifejezésre, akkor a kapott találatoksorrendje jól tükrözi azt, hogy melyik oldal mennyire hasznos számunkraa keresett kifejezéssel kapcsolatban.

Ahogy Meyer írja [1, 662. oldal 4. sor]: �A Perron�Frobenius tételkörelegáns. Annak a ténynek a megtestesülése, hogy a gyönyör¶ matematika néhahasznos, és a hasznos matematika néha gyönyör¶.�.

6

Page 7: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

1. fejezet

Algebrai összefoglaló

Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetvejelöléseiket, amelyeket a kés®bbi fejezetek során használni fogunk. Egy Amátrix és egy v vektor koordinátáit a szokásos módon aij és vi jelöli, aszorzatuk koordinátáit pedig [Av]i fogja jelölni. Továbbá |A| az A mátrixabszolút értékét jelöli, tehát a koordinátái az eredeti mátrix |aij| elemei. Amátrix rangját rang(A) fogja jelölni.

1.0.1. De�níció. Egy A ∈ Rm×n mátrix pozitív, ha minden i-re és j-reaij > 0. Jelölés: A > 0. Ha B ∈ Rm×n, akkor A > B azt jelenti, hogy mindeni-re és j-re aij > bij. Hasonlóan, A nemnegatív, ha minden aij ≥ 0 (jelölés:A ≥ 0) és A ≥ B, ha minden aij ≥ bij.

1.0.2. De�níció. Egy A ∈ Rn×n mátrixnak egy λ ∈ C szám a sajátértéke,ha létezik olyan v ∈ Rn×1, v 6= 0, hogy Av = λv. Ekkor v a λ-hoz tartozójobb oldali sajátvektor. Ha pedig w ∈ R1×n, w 6= 0 és wA = λw, akkor w aλ-hoz tartozó bal oldali sajátvektor.

1.0.3. De�níció. Egy A mátrix spektrumának nevezzük a sajátértékeinek ahalmazát. Jelölés: σ(A).

1.0.4. De�níció. Egy A mátrix spektrálsugarának nevezzük a sajátértékeiabszolút értékeinek a maximumát. Jelölés: ρ(A).

1.0.5. De�níció. Egy A mátrix hasonló egy B mátrixhoz, ha létezik olyanC invertálható mátrix, hogy B = C−1AC.

1.0.6. De�níció. Egy A mátrix magterén a Ker(A) = {x ∈ Rn | Ax = 0}halmazt értjük. A mátrix képtere pedig Im(A) = {Ax | x ∈ Rn}.

7

Page 8: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

1. FEJEZET. ALGEBRAI ÖSSZEFOGLALÓ

1.0.7. Állítás. Egy A mátrix rangja megegyezik a képterének a dimenziójá-val, azaz rang(A) = dim Im(A).

Bizonyítás: Legyen x ∈ Rn tetsz®leges és rang(A) = m, azaz A oszlopaibólm lineárisan függetlent tudunk kiválasztani. Jelölje az A mátrixi-edik oszlopát ai, ekkor az Ax szorzat a következ®képpen írható fel:Ax = a1x1 + . . .+ anxn. Ekkor az összes lehetséges Ax szorzatot az Aoszlopai közül kiválasztható m független oszlop generálja, tehát az{Ax | x ∈ Rn} halmaz m dimenziós, azaz dim Im(A) = m = rang(A). �

1.0.8. De�níció. (Jordan-féle normálalak) Legyen A ∈ Rn×n, és legyenJi egy olyan négyzetes mátrix, amelynek a f®átlójában végig az A mátrixλi sajátértéke szerepel, a f®átló feletti átlóban végig 1-esek szerepelnek, azösszes többi eleme pedig nulla, és legyen J a következ® mátrix:

J =

J1 0. . .

0 Jm

, ahol Ji =

λi 1 0

λi. . .. . . 1

0 λi

Ekkor J f®átlójában az úgynevezett Jordan-blokkok szerepelnek, azon kívülpedig nullák. Ha létezik J-hez egy olyan P invertálható mátrix, amelyre Afelírható A = PJP−1 alakban (azaz, ha A hasonló J-hez), akkor azt mondjuk,hogy J az A mátrix Jordan-féle normálalakja.

1.0.9. De�níció. Egy A ∈ Rn×n mátrix nilpotens, ha létezik olyan k ∈ Nszám, amelyre Ak = 0.

1.0.10. De�níció. Egy A ∈ Rn×n mátrix reducibilis, ha létezik egy olyanP ∈ Rn×n permutációs mátrix, illetve B, C, D mátrixok úgy, hogy

P TAP =

(B C0n−r,r D

), ahol 1 ≤ r ≤ n− 1.

Itt 0n−r,r egy olyan (n−r)×r méret¶ mátrixot jelöl, amelynek minden elemenulla, B ∈ Rr×r és C ∈ R(n−r)×(n−r) pedig négyzetes mátrixok. Vegyük észre,hogy a B, C és D mátrixokról csak annyit teszünk fel, hogy van legalább egynemnulla elemük, továbbá fontos, hogy B és D legalább 1 × 1-es mátrixoklegyenek. Így például az 1× 1-es mátrixok nem reducibilisek.

Ezt a P TAP mátrixot az A mátrix szimmetrikus permutációjánaknevezzük, ugyanis pontosan azokat a sorokat cseréli fel az eredeti Amátrixban, amely oszlopokat is.

8

Page 9: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

1. FEJEZET. ALGEBRAI ÖSSZEFOGLALÓ

1.0.11. De�níció. Egy A mátrix irreducibilis, ha nem reducibilis.

1.0.12. De�níció. Az A ∈ Rn×n mátrixhoz tartozó G(A) gráf egy olyanirányított gráf, amelynek n csúcsa van, legyenek ezek {V1, . . . , Vn}, és egy Vicsúcsból irányított él vezet a Vj csúcsba akkor és csak akkor, ha aij 6= 0.

Vegyük észre, hogy ha P egy permutációs mátrix, akkorG(P TAP ) = G(A), hiszen az A mátrixhoz tartozó gráf csúcsait átcímkézvekönnyen megkaphatjuk a P TAP mátrixhoz tartozó gráfot.

1.0.13. De�níció. Egy irányított G gráf er®sen összefügg®, ha bármelypontjából bármely más pontjába vezet irányított út.

1.0.14. Tétel. Egy A mátrix akkor és csak akkor irreducibilis, ha a hozzátartozó G(A) gráf er®sen összefügg®.

Ennek a tételnek a bizonyítása megtalálható az [1] irodalomban, a 4.4.20.feladat megoldásánál a 36. oldalon.

1.0.15. De�níció. Ha létezik olyan k > 1 szám, amelyre az Ak mátrixf®átlójában minden elem pozitív, akkor azt mondjuk, hogy A periodikus. Haez teljesül k = 1 esetén (azaz ha minden i esetén aii > 0), akkor azt mondjuk,hogy A aperiodikus.

9

Page 10: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. fejezet

Perron�Frobenius tétel pozitívmátrixokra

Ez a tétel két német matematikus, Oskar Perron és Ferdinand GeorgFrobenius nevéhez f¶z®dik. A tételt Perron 1907-ben eredetileg csakpozitív mátrixok esetére dolgozta ki, kés®bb pedig Frobenius terjesztette kinemnegatív mátrixokra 1912-ben. Ebben a fejezetben a pozitív mátrixokrólszóló Perron tétellel ismerkedhetünk meg.

2.0.1. Tétel. (Perron) Legyen A ∈ Rn×n pozitív mátrix, ρ(A) = r. Ekkora következ® állítások teljesülnek.

• r > 0, azaz A spektrálsugara pozitív. (2.1)

• r ∈ σ(A), azaz r sajátértéke A-nak és ekkor azt mondjuk,hogy r az A-hoz tartozó Perron�Frobenius sajátérték. (2.2)

• Létezik egy x > 0 sajátvektor, amelyre Ax = rx. (2.3)

• r egyszeres sajátértéke A-nak. (2.4)

• A-nak egyértelm¶en létezik egy olyan p > 0 sajátvektora,

amelyre Ap = rp ésn∑i=1

pi = 1, továbbá A-nak p pozitív

skalárszorosain kívül nem létezik más nemnegatív saját-vektora. Ez az úgynevezett Perron vektor. (2.5)

• Nem létezik A-nak másik olyan sajátértéke, amelynek azabszolút értéke egyenl® r-rel. (2.6)

10

Page 11: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

• Collatz-Wielandt formula: r = maxx∈N

f(x),

ahol f(x) = min1≤i≤nxi 6=0

[Ax]ixi

és N = {x | x ≥ 0 és x 6= 0} (2.7)

• Ha A minden sorának (vagy oszlopának) az összege egyenl®egy ρ számmal, akkor r = ρ. (2.8)

• mini

n∑j=1

aij ≤ r ≤ maxi

n∑j=1

aij (2.9)

Bizonyítás:

• r > 0, azaz A spektrálsugara pozitív.Indirekt tegyük fel, hogy ρ(A) = 0, azaz σ(A) = {0}. Ez aztjelenti, hogy A-nak az egyetlen sajátértéke a 0, vagyis A Jordannormálalakjában a f®átlóban végig nullák szerepelnek, tehát egy JiJordan-blokk a következ®képpen néz ki:

Ji =

0 1 0

0. . .. . . 1

0 0

Ha egy ilyen mátrixot elégszer hatványozunk, végül nullmátrixotkapunk, tehát létezik egy olyan ki szám, amelyre Jkii = 0. Tudjuk,hogy a J mátrix k-adik hatványa úgy néz ki, hogy a f®átlóban a Jordan-blokkok k-adik hatványai szerepelnek, az összes többi eleme pedig nulla:

J =

J1 0. . .

0 Jm

=⇒ Jk =

Jk1 0

. . .

0 Jkm

Így, ha ezt a J mátrixot hatványozzuk, egy id® után nullmátrixotkapunk, tehát létezik egy olyan k szám (k = max

iki), amelyre Jk = 0,

vagyis A Jordan normálalakja nilpotens, és így A is nilpotens, mivelAk = PJkP−1 = 0. Ez viszont ellentmondás, ugyanis A pozitív.

11

Page 12: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

• r ∈ σ(A) és létezik egy x > 0 sajátvektor, amelyre Ax = rx.ρ(A) = r azt jelenti, hogy A-nak létezik egy olyan λ sajátértéke, amire|λ| = r. Azt fogjuk belátni, hogy λ = r és a hozzá tartozó sajátvektorpozitív. Feltehet®, hogy ρ(A) = 1, ugyanis A > 0 akkor és csak akkor,ha A/ρ(A) > 0, és ρ(A) = r ekvivalens azzal, hogy ρ(A/r) = 1. Teháttegyük fel, hogy ρ(A) = 1, ekkor |λ| = 1 és legyen a λ-hoz tartozósajátvektor x, azaz Ax = λx. Ekkor:

|x| = |λ||x| = |λx| = |Ax| ≤ |A||x| = A|x| =⇒ |x| ≤ A|x| (2.10)

Azt fogjuk megmutatni, hogy egyenl®ség áll fenn. Legyen z = A|x| ésy = z−|x|, ekkor a (2.10) egyenl®tlenség a következ® módon írható át:

|x| ≤ A|x| = z =⇒ 0 ≤ z − |x| = y

Tegyük fel, hogy y 6= 0, ekkor (mivel y nemnegatív) létezik egy olyani index, amelyre yi > 0. Abból, hogy A > 0 és y ≥ 0, az következik,hogy Ay > 0 és z > 0. Ekkor létezik ε > 0 úgy, hogy:

εz < Ay =A(z − |x|) = Az − A|x| = Az − z=⇒ Az − z > εz

=⇒ Az > z + εz = (1 + ε)z

=⇒ A

1 + εz > z

Vezessük be a B =A

1 + εjelölést, így a fenti egyenl®tlenség alapján

Bz > z, amit ha beszorzunk B-vel balról, a következ®t kapjuk:

B2z > Bz > z =⇒ B3z > B2z > z =⇒ . . . =⇒ Bkz > z ∀k ∈ N+

(2.11)Vegyük azonban �gyelembe a következ®ket:

ρ(B) = ρ

(A

1 + ε

)=

1

1 + ε< 1 =⇒ lim

k→∞Bk = 0 (2.12)

Ahhoz, hogy ezt belássuk, bizonyítás nélkül felhasználjuk a következ®egyenl®séget, ez az úgynevezett Gelfand formula. Az állítás bizonyításamegtalálható az [1] irodalomban, a 7.10.1 példánál a 619. oldalon.

ρ(A) = limk→∞

∥∥Ak∥∥1/k (2.13)

12

Page 13: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

Ez teljesül tetsz®leges mátrix norma esetén, tehát speciálisan a végtelennormára is igaz. Így tehát azt írhatjuk fel, hogy:

1 > ρ(B) = limk→∞

∥∥Bk∥∥1/k∞

Ekkor létezik egy olyan ε ∈ (0, 1) és N ∈ N, hogy minden k ≥ N esetén:∥∥Bk∥∥1/k∞ < 1− ε

Így, ha mindkét oldalt a k-adik hatványra emeljük:

0 <∥∥Bk

∥∥∞ < (1− ε)k < 1

Ekkor (1− ε)k −→ 0, ha k −→∞, és így mivel az egyenl®tlenség jobboldala nullához tart, a rend®r elv alapján

∥∥Bk∥∥∞ −→ 0, amib®l pedig

az következik, hogy Bk −→ 0. Ezzel tehát beláttuk a (2.12) állítást.

Ekkor a (2.11) egyenl®tlenségb®l határátmenettel azt kapjuk, hogy0 ≥ z, ami ellentmondás, hiszen z pozitív. Tehát helytelen volt az afeltevésünk, hogy y 6= 0, amib®l az következik, hogy 0 = y = A|x|− |x|.Ezzel bebizonyítottuk, hogy r = 1 sajátértéke az A mátrixnak, és ahozzá tartozó sajátvektor pedig |x| > 0.

Ezzel a bizonyítással tulajdonképpen a következ® fontos állítást isbeláttuk:

Ha Ax = ρ(A)x és x 6= 0, akkor A|x| = ρ(A)|x| és |x| > 0. (2.14)

• r egyszeres sajátértéke A-nak.Ahhoz, hogy ezt belássuk, szükségünk lesz a következ® állításra, tehátel®ször ezt fogjuk igazolni:

Az A mátrix Jordan normálalakjában a ρ(A)-hoz tartozólegnagyobb Jordan-blokk 1× 1-es méret¶. (2.15)

Feltehet®, hogy ρ(A) = 1, ugyanis A > 0 akkor és csak akkor, haA/ρ(A) > 0, és ρ(A) = r ekvivalens azzal, hogy ρ(A/r) = 1. Teháttegyük fel, hogy ρ(A) = 1 és tegyük fel, hogy az r = 1-hez tartozólegnagyobb Jordan-blokk mérete m > 1, legyen ez az i-edik Jordan-blokk, azaz Ji ∈ Rm×m, ahol:

Ji =

1 1 0

1. . .. . . 1

0 1

13

Page 14: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

Ha ezt a mátrixot hatványozzuk, a mátrix elemei egyre nagyobbaklesznek, tehát

∥∥Jki ∥∥∞ −→∞, ha k −→∞, amib®l pedig az következik,hogy

∥∥Jk∥∥∞ −→ ∞. Mivel A = PJP−1, ezért J = P−1AP , tehátJk = P−1AkP , aminek ha vesszük a végtelen normáját, a következ®tkapjuk: ∥∥Jk∥∥∞ =

∥∥P−1AkP∥∥∞ ≤ ∥∥P−1∥∥∞ ∥∥Ak∥∥∞ ‖P‖∞Oszzuk el az egyenl®tlenség két oldalát ‖P−1‖∞ ‖P‖∞-val:∥∥Ak∥∥∞ ≥

∥∥Jk∥∥∞‖P−1‖∞ ‖P‖∞

−→∞

A rend®r-elv alapján tehát∥∥Ak∥∥∞ −→ ∞ ha k −→ ∞. Jelölje az Ak

mátrix i-edik sorának j-edik elemét a(k)ij , és legyen ik az a sor Ak-ban,amelynek a legnagyobb a sorösszege, azaz:∥∥Ak∥∥∞ =

∑j

a(k)ikj

A tétel (2.3) pontja alapján létezik egy olyan x > 0, amelyre x = Ax.Nézzük a következ® egyenl®tlenséget:

‖x‖∞ ≥ xik = [Ax]ik =∑j

a(k)ikjxj ≥

(∑j

a(k)ikj

)(min

ixi) −→∞

Ebb®l az következik, hogy ‖x‖∞ −→ ∞, ami viszont ellentmondás,hiszen x egy konstans vektor. Így tehát hibás volt az a feltevésünk,miszerint m > 1, tehát m = 1, azaz beláttuk a (2.15) állítást. A tétel(2.4) pontjának igazolásához szükségünk lesz a következ® állításra:

Ha az A mátrixnak r egy m-szeres sajátértéke, akkor az r-heztartozó lineárisan független sajátvektorok száma éppen m. (2.16)

Ahhoz, hogy ezt bebizonyítsuk, vizsgáljuk meg, hogy hogyan is néz kiA Jordan-normálalakja. A (2.15) állítás alapján az r-hez tartozó összesJordan-blokk 1× 1-es méret¶, tehát:

P−1AP = J =

(rIm,m 00 B

)

14

Page 15: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

Itt Im,m az m × m méret¶ egységmátrixot jelöli, B pedig egy olyanmátrix, amelyre r /∈ σ(B). Vizsgáljuk meg az (A− rI) mátrix rangját:

rang(A− rI) = rang

(P

(0 00 B − rI

)P−1

)= rang(B − rI) = n−m

Most használjuk fel a dimenziótételt:

dim Im(A− rI) + dimKer(A− rI) = n (2.17)

A 1.0.7 Állítás alapján dim Im(A − rI) = rang(A − rI), és mivelkiszámoltuk, hogy rang(A − rI) = n − m, így a (2.17) egyenl®ségb®lazt kapjuk, hogy:

n−m+ dimKer(A− rI) = n =⇒ dimKer(A− rI) = m

Vegyük észre, hogy dimKer(A − rI) = m azt jelenti, hogy azr-hez tartozó lineárisan független sajátvektorok száma éppen m, ezzeltehát beláttuk a (2.16) állítást. Nézzük tehát a tétel (2.4) pontjánakbizonyítását, azaz lássuk be, hogy r egyszeres sajátértéke A-nak.

Tegyük fel, hogy r = 1 egy olyan sajátértéke A-nak, amelynek amultiplicitása m > 1. Ez tehát a (2.16) állítás alapján azt jelenti, hogyaz r-hez tartozó lineárisan független sajátvektorok száma éppen m. Hax és y két olyan sajátvektor, amelyek az r = 1 sajátértékhez tartoznak,és lineárisan függetlenek, akkor minden α ∈ C esetén x 6= αy. Ekkortehát Ax = x és Ay = y, azaz:

Ax− x = 0 = Ay − y (2.18)

Mivel az egyenlet jobb és bal oldala is a nullvektorral egyenl®,ezért megtehetjük, hogy az egyenlet jobb oldalát beszorozzuk egykonstanssal, hiszen akkor is ugyanúgy a nullvektort kapjuk eredményül.Válasszunk ki y-ból egy nemnulla komponenst, legyen ez yi 6= 0, ésszorozzuk be az xi/yi számmal a (2.18) jobb oldalát:

Ax− x =

(xiyi

)Ay −

(xiyi

)y

Ax−(xiyi

)Ay = x−

(xiyi

)y

A

(x−

(xiyi

)y

)= x−

(xiyi

)y (2.19)

15

Page 16: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

Legyen z = x− (xi/yi)y, ekkor z 6= 0 mivel x és y függetlenek. A (2.19)egyenl®ség alapján Az = z, azaz z sajátvektora A-nak, ekkor a (2.14)állítás alapján A|z| = |z| > 0, de:

zi = xi −(xiyi

)yi = xi − xi = 0

Ez pedig ellentmondás, tehát hibás volt a feltevésünk, miszerint m > 1,tehát m = 1, azaz r valóban egyszeres sajátértéke A-nak.

• A-nak egyértelm¶en létezik egy p > 0 sajátvektora, amelyre Ap = rp ésn∑i=1

pi = 1.

Azt már beláttuk a tétel (2.3) pontjánál, hogy létezik A-nak olyanpozitív sajátvektora, amely az r sajátértékhez tartozik, tehát csakannyit kell igazolni, hogy ez el®állítható úgy, hogy az elemeinek összege1-gyel egyenl®, és hogy ez egyértelm¶. Legyen x olyan pozitív vektor,hogy Ax = rx, és legyen p a következ® vektor:

p =x

‖x‖1

Ekkor p elemeinek az összege pont 1 lesz, hiszen:

n∑i=1

pi =n∑i=1

xi‖x‖1

=

n∑i=1

xi

‖x‖1=‖x‖1‖x‖1

= 1

Így már csak az egyértelm¶séget kell igazolni. Tegyük fel, hogy léteznekp1 és p2 sajátvektorai A-nak úgy, hogy Ap1 = rp1, p1 > 0, ‖p1‖1 = 1,illetve Ap2 = rp2, p2 > 0, ‖p2‖1 = 1. Ez azt jelenti, hogy p1 és p2 is azr sajátértékhez tartozó sajátvektorai A-nak. Mivel r csak egyszeressajátérték, ezért a hozzá tartozó lineárisan független sajátvektorokszáma is 1, amib®l pedig az következik, hogy valamilyen α ∈ R esetén:

p1 = αp2

Vegyük mindkét oldal 1-es normáját:

1 = ‖p1‖1 = ‖αp2‖1 = |α| ‖p2‖1 = |α| =⇒ α = ±1

Mivel p1 és p2 is pozitívak, így biztos, hogy α 6= −1, tehát α = 1, ésígy p1 = p2.

16

Page 17: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

• A-nak p skalárszorosain kívül nem létezik más nemnegatív sajátvektora.Legyen λ olyan sajátértéke és y ≥ 0 olyan sajátvektora A-nak, amelyreAy = λy. Legyen p > 0 az AT -hoz tartozó Perron vektor, azaz:

AT p = rp

Ha ezt transzponáljuk, majd beszorozzuk mindkét oldalt jobbról y-nal,akkor azt kapjuk, hogy:

pTAy = rpTy

Felhasználva, hogy Ay = λy, azt kapjuk, hogy:

pTλy = rpTy =⇒ λpTy = rpTy

Mivel pTy > 0, ez pontosan akkor teljesül, ha λ = r, és mivel azel®bb már beláttuk, hogy A-nak egyértelm¶en létezik r-hez tartozósajátvektora, így létezik egy olyan α ≥ 0 szám, amelyre y = αp.

• Nem létezik A-nak másik olyan sajátértéke, amelynek az abszolút értékeegyenl® r-rel.Ismét feltehet®, hogy r = 1. Legyen |λ| = 1 sajátértéke A-nak, és legyena hozzá tartozó sajátvektor x, azaz:

n∑j=1

akjxj = λxk ∀k

A (2.14) állítás alapján 0 < |x| = A|x|, tehát:

0 < |xk| = [A |x|]k =n∑j=1

akj |xj|

Ugyanakkor vegyük �gyelembe a következ®eket:

|xk| = |λ||xk| = |λxk| = |[λx]k| = | [Ax]k | =

∣∣∣∣∣n∑j=1

akjxj

∣∣∣∣∣Ha egyenl®vé tesszük ezt a két szummát, amit |xk|-ra felírtunk, akkorazt kapjuk, hogy:∣∣∣∣∣

n∑j=1

akjxj

∣∣∣∣∣ =n∑j=1

akj |xj| =n∑j=1

|akjxj| (2.20)

Itt a második egyenl®ség azért teljesül, mert A minden eleme pozitív.Tudjuk, hogy ha a {z1, . . . , zn} ⊂ Cn nemnulla vektoroknak egy

17

Page 18: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

halmaza, akkor ‖∑

j zj‖2 =∑

j ‖zj‖2 akkor és csak akkor, ha mindenj esetén létezik olyan αj > 0, hogy zj = αjz1. Ez azért igaz, mert akettes norma az euklideszi távolságot jelöli, és a vektorok összegének atávolsága csak akkor lehet egyenl® a távolságaik összegével, ha mindenvektor egy irányba mutat, azaz ha egymásnak a pozitív többszörösei.Ezt alkalmazhatjuk vektorok helyett skalárokra is, és így a (2.20)egyenl®ség alapján léteznek olyan αj > 0 skalárok, hogy:

akjxj = αj(ak1x1), azaz xj = πjx1, ahol πj =αjak1akj

> 0

Ekkor tehát ha |λ| = 1, akkor x = x1p, ahol p =(1 π2 . . . πn

)T> 0,

így:

λx = Ax =⇒ λp = Ap = |Ap| = |λp| = |λ||p| = |λ|p = p =⇒ λ = 1

Itt Ap = |Ap| azért teljesül, mert A is és p is pozitívak, tehát Ap is. Ígytehát azt kaptuk, hogy λ = 1 = r, tehát valóban a Perron�Frobeniussajátérték az egyetlen r abszolút érték¶ sajátértéke A-nak.

• r = maxx∈N

f(x)

Legyenek A r-hez tartozó jobb és baloldali sajátvektorai p és qT . Legyenx ∈ N és ξ = f(x). Ekkor 0 ≤ ξx ≤ Ax, ugyanis ha indirekt feltesszük,hogy létezik egy olyan j index, amelyre [Ax]j < ξxj, akkor:

[Ax]jxj

< ξ = min1≤i≤nxi 6=0

[Ax]ixi

Ez pedig ellentmondás, tehát valóban ξx ≤ Ax. Ha az egyenl®tlenségmindkét oldalát beszorozzuk balról qT -tal (ezt megtehetjük, hiszen qnemnegatív) és felhasználjuk, hogy qTA = rqT , akkor azt kapjuk, hogy:

ξqTx ≤ qTAx = rqTx

Mivel qTx > 0, így ebb®l következik, hogy ξ ≤ r, azaz f(x) ≤ r mindenx ∈ N esetén. Mivel p az A-hoz tartozó Perron vektor, így Ap = rp,amib®l következik, hogy minden i index esetén [Ap]i = rpi, tehát:

[Ap]ipi

= r

Ez teljesül minden i-re, így a minimum is egyenl® r-rel, tehát f(p) = r.Mivel p ∈ N , így azt kapjuk, hogy r = max

x∈Nf(x).

18

Page 19: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

• Ha A minden sorának (vagy oszlopának) az összege egyenl® egy ρszámmal, akkor r = ρ.Legyen e a csupa 1-esekb®l álló vektor, ekkor Ae = ρe, ami azt jelenti,hogy az A mátrixnak e egy sajátvektora. Mivel e pozitív, így a tétel(2.5) pontja miatt biztos, hogy ez az A-hoz tartozó p Perron vektornakvalamely skalárszorosa, azaz létezik egy olyan α szám, amelyre p = αe.Helyettesítsük ezt be az Ap = rp egyenletbe:

Aαe = rαe

Mivel Ae = ρe, így azt kapjuk, hogy:

αρe = rαe =⇒ ρ = r

• mini

n∑j=1

aij ≤ r ≤ maxi

n∑j=1

aij

Ehhez el®ször belátjuk az alábbi állítást, amit majd kés®bbfelhasználunk a bizonyítás során.

|A| ≤ B =⇒ ρ(A) ≤ ρ(|A|) ≤ ρ(B) (2.21)

A háromszög egyenl®tlenségb®l következik, hogy |Ak| ≤ |A|k minden kpozitív egész esetén. Ezenkívül abból, hogy 0 ≤ |A| ≤ B, az következik,hogy |A|k ≤ Bk. A (2.13) egyenl®ség (Gelfand formula), illetve az el®bbikét egyenl®tlenség alapján:∥∥Ak∥∥∞ =

∥∥|Ak|∥∥∞ ≤∥∥|A|k∥∥∞ ≤ ∥∥Bk∥∥∞

⇓∥∥Ak∥∥1/k∞ ≤∥∥|A|k∥∥1/k∞ ≤ ∥∥Bk∥∥1/k∞

limk→∞

∥∥Ak∥∥1/k∞ ≤ limk→∞

∥∥|A|k∥∥1/k∞ ≤ limk→∞

∥∥Bk∥∥1/k∞

⇓ρ(A) ≤ ρ(|A|) ≤ ρ(B)

Ezzel beláttuk a (2.21) állítást. Most nézzük tehát a tételben szerepl®egyenl®tlenség bizonyítását. Legyen ρ a legnagyobb sorösszeg A-ban,azaz:

ρ = maxi

n∑j=1

aij

19

Page 20: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

Ekkor létezik egy olyan E ≥ 0mátrix, amelyre teljesül, hogy B = A+Eminden sorának összege egyenl® ρ-val. A tétel (2.7) pontja alapjánekkor ρ(B) = ρ, tehát (2.21)-et felhasználva azt kapjuk, hogy:

r = ρ(A) ≤ ρ(B) = ρ = maxi

n∑j=1

aij

Ezzel beláttuk a jobb oldali egyenl®tlenséget. A bal oldalibizonyításához legyen e a csupa 1-esekb®l álló vektor, ekkor e ∈ N ,így a Collatz-Wielandt formula alapján:

r = maxx∈N

f(x) ≥ f(e) = mini

[Ae]iei

= mini

n∑j=1

aij

2.1. A Collatz-Wielandt formula másik alakja

A tételben szerepl® Collatz-Wielandt formulával úgy kaphatjuk meg aPerron�Frobenius sajátértéket, hogy el®ször nézzük az Ax és x vektorokelem-hányadosainak a minimumát, majd megkeressük, hogy ez milyen xvektor esetén lesz a legnagyobb, és ez a maximum lesz r. Ezt úgy iskiszámolhatjuk, hogy el®ször vesszük a hányadosok maximumát, és utánanézzük ezeknek a minimumát, azaz, ha A egy pozitív mátrix, akkorr = min

x∈Pg(x), ahol:

g(x) = max1≤i≤n

[Ax]ixi

és P = {x | x > 0}

Ezt az eredeti formulához hasonlóan tudjuk belátni. Legyenek tehát az Amátrix r-hez tartozó jobb és baloldali sajátvektorai p és qT . Legyen x ∈ Ptetsz®leges és ξ = g(x). Ekkor 0 < Ax ≤ ξx, ezt szorozzuk be balról anemnegatív qT -tal:

qTAx ≤ qT ξx

Mivel qT az A mátrix baloldali sajátvektora, így az egyenl®tlenség bal oldalaátírható rqTx-re:

rqTx ≤ qT ξx = ξqTx

Felhasználva, hogy qTx > 0, ebb®l az következik, hogy r ≤ ξ, tehát r ≤ g(x)minden x ∈ P esetén. Mivel p ∈ P az A-hoz tartozó Perron vektor, így

20

Page 21: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

minden i index esetén [Ap]i /pi = r, tehát a maximumuk is egyenl® r-rel,azaz g(p) = r, így:

r = minx∈P

g(x)

Vegyük észre, hogy a tételben szerepl® Collatz-Wielandt formulábanN = {x | x ≥ 0 és x 6= 0} szerepel, míg ebben a másik alakban aP = {x | x > 0} halmazt alkalmazzuk. Most nézzük meg, hogy mi történne,ha az eredeti N halmazon vennénk a Collatz-Wielandt formulának ezt amásik alakját. De�niáljuk g(x)-et a következ®képpen:

g(x) = max1≤i≤nxi 6=0

[Ax]ixi

Most mutatunk példát egy olyan A mátrixra, amely pozitív, deρ(A) 6= min

x∈Ng(x).

A =

(1 22 4

)Ennek a mátrixnak a két sajátértéke a 0 és az 5, tehát ρ(A) = 5. Nézzük azalábbi vektorokat:

x =

(10

)Ax =

(12

)Ekkor x ∈ N , de g(x) = 1, tehát:

minx∈N

g(x) ≤ 1 < 5 = ρ(A)

⇓minx∈N

g(x) < ρ(A)

2.2. Jobb és bal oldali Perron vektor

Tudjuk, hogyA > 0 ekvivalens azzal, hogyAT > 0, továbbá ha ρ(A) = r,akkor ρ(AT ) = r. Így ha A pozitív, és az r-hez tartozó Perron vektora p,akkor létezik egy hozzá tartozó q Perron vektora az AT mátrixnak, amita következ®képpen kapunk meg. Legyen az AT mátrixnak az r-hez tartozóPerron vektora p, azaz:

AT p = rp

Transzponáljuk ezt az egyenletet:

pTA = rpT

21

Page 22: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

Ekkor tehát pT egy A-hoz tartozó bal oldali sajátvektor, amely aPerron�Frobenius sajátértékhez tartozik. Normáljuk ezt a p vektort úgy, hogya normált vektor q = αp legyen és teljesüljön az, hogy:

qTp =n∑i=1

qipi = 1

Ekkor tehát qTA = αpTA = αrpT = r(αpT ) = rqT , azaz qT egy bal oldalisajátvektora A-nak, amely a Perron�Frobenius sajátértékhez tartozik. Ezt aqT vektort nevezzük az A mátrix bal oldali Perron vektorának. Mivel AT > 0,így a Perron tétel alapján egyértelm¶en létezik egy ilyen p > 0, amib®l azkövetkezik, hogy qT is pozitív és egyértelm¶.

Az alábbiakban láthatunk két fontos összefüggést az A mátrix jobb ésbal oldali Perron vektoraira vonatkozóan.

2.2.1. Tétel. Ha A ∈ Rn×n egy pozitív mátrix és ρ(A) = r, továbbá az A-hoztartozó jobb és bal oldali Perron vektorok p és qT , akkor létezik egy olyan Sinvertálható mátrix, amelyre

A = S

(r 00 B

)S−1,

ahol B egy (n−1)×(n−1) méret¶ mátrix, S els® oszlopában a p vektor szerepel

(ezt jelölje S =(p S1

)), S−1 els® sorában pedig qT áll, (azaz S−1 =

(qT

Z1

)).

Bizonyítás: Válasszunk ki egy s1, . . . , sn−1 bázist q ortogonális kiegészít®alteréb®l, és legyenek ezek az S1 mátrix oszlopai, ekkor tehát qTS1 = 0.Legyen S =

(p S1

)és legyen z egy olyan vektor, amelyre z =

(z1 c

)T, ahol

c egy n−1 hosszú vektor. Tegyük fel, hogy Sz = 0, ekkor qT (Sz) = qT ·0 = 0,tehát:

0 = qT (Sz) = qT (pz1 + S1c) = (qTp)z1 + (qTS1)c = 1 · z1 + 0 · c = z1

Tehát z1 = 0, ekkor 0 = Sz = pz1 + S1c = p · 0 + S1c = S1c, ami csakakkor lehetséges, ha c = 0, hiszen S1 egy teljes rangú mátrix (mert ígyállítottuk el®). Így tehát z minden koordinátája nulla, és ezzel azt kaptuk,hogy Sz = 0⇐⇒ z = 0, tehát S invertálható.

Legyen S−1 =

(dZ1

), ahol d egy n hosszúságú sorvektor és számítsuk ki az

S−1S mátrixot:

In = S−1S =

(dZ1

)(p S1

)=

(dp dS1

Z1p Z1S1

)=

(1 00 In−1

)(2.22)

22

Page 23: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

Itt In az n dimenziós egységmátrixot jelöli. Abból, hogy dS1 = 0, azkövetkezik, hogy d mer®leges S1-re, azaz a q ortogonális kiegészít® alterére,tehát létezik egy olyan α skalár, hogy dT = αq, azaz d = αqT . A (2.22)egyenlet alapján dp = 1, így:

1 = dp = (αqT )p = α(qTp) = α · 1 = α =⇒ d = qT

Továbbá a (2.22) egyenlet alapján dS1 = qTS1 = 0 és Z1p = 0, így:

S−1AS =

(qT

Z1

)A(p S1

)=

(qTAp qTAS1

Z1Ap Z1AS1

)=

((rqT )p (rqT )S1

Z1(rp) Z1AS1

)=

(r(qTp) r(qTS1)r(Z1p) Z1AS1

)=

(r · 1 r · 0r · 0 Z1AS1

)=

(r 00 Z1AS1

)Ezek alapján ha bevezetjük a B = Z1AS1 jelölést és beszorzunk balról S-sel,jobbról pedig S−1-zel, akkor éppen a tételben szerepl® alakját kapjuk A-nak.

2.2.2. Tétel. Legyen A ∈ Rn×n egy pozitív mátrix és ρ(A) = r, illetvelegyenek az A-hoz tartozó jobb és bal oldali Perron vektorok p és qT . Ekkor

limk→∞

(A

r

)k

= pqT

és a pqT egy olyan mátrix, amely pozitív, és rang(pqT ) = 1.

Bizonyítás: A 2.2.1 Tétel alapján léteznek olyan S =(p S1

)és

S−1 =

(qT

Z1

)mátrixok, hogy:

S−1AS =

(r 00 B

)=: C

Ekkor az A mátrix hasonló a C mátrixhoz, és mivel A-nak r egyszeressajátértéke és r-en kívül minden más sajátértéke abszolút értékben kisebb,mint r = ρ(A), így C-nek is egyszeres sajátértéke r, és így ρ(B) < r, tehát:

ρ(B)

r= ρ(

B

r) < 1

23

Page 24: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

Így a (2.12) állítás alapján:

limk→∞

(B

r

)k= 0

Ebb®l pedig következik a tétel els® állítása, ugyanis:

limk→∞

(A

r

)k= lim

k→∞

(S

(C

r

)S−1

)k= lim

k→∞S

(C

r

)kS−1

= limk→∞

S

(rr

00 B

r

)kS−1 = lim

k→∞S

(1k 0

0(Br

)k)S−1= S

(1 00 0n−1

)S−1 =

(p S1

)(1 00 0n−1

)(qT

Z1

)= pqT

Itt 0n−1 egy olyan (n − 1) × (n − 1)-es négyzetes mátrixot jelöl, amelynekminden eleme nulla. Mivel p és q is pozitívak, így szükségképpen pqT ispozitív. Az pedig, hogy rang(pqT ) = 1 könnyen látszik, hiszen pqT hasonlóegy olyan mátrixhoz, amelynek az els® eleme 1 és minden más eleme nulla,így csak egyetlen lineárisan független sort vagy oszlopot tudunk kiválasztanibel®le (az els®t), tehát a rangja 1.

2.3. A pozitivitás szükségessége

Most megmutatjuk, hogy mi történne, ha a Perron tételben szerepl®feltételt elhagynánk, miszerint A pozitív. Ehhez tehát olyan A négyzetesmátrixokat láthatunk majd, amelyekre teljesül, hogy A ≥ 0, de A 6> 0 (azazA-nak van legalább egy nulleleme) és r = ρ(A) ∈ σ(A). Vegyük el®ször azalábbi mátrixot:

A1 =

(0 10 0

)Ekkor r = ρ(A1) = 0, mivel A1 egyetlen sajátértéke a 0, így nem teljesülne atétel (2.1) pontja, azaz, hogy r > 0.

A2 =

(3 20 3

)Ennek a mátrixnak a 3 kétszeres sajátértéke, tehát ha elhagynánk azt afeltételt, hogy A legyen pozitív, akkor nem teljesülne a tétel (2.4) pontja,

24

Page 25: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

2. FEJEZET. PERRON�FROBENIUS TÉTEL POZITÍV MÁTRIXOKRA

miszerint r = ρ(A2) = 3 csak egyszeres sajátértéke A-nak. S®t, módosítsuka mátrixot úgy, hogy a jobb fels® eleme is nulla legyen:

A2 =

(3 00 3

)Így A2-nak szintén kétszeres sajátértéke a 3, és tartozik hozzá két lineárisanfüggetlen sajátvektor:

x =

(10

)y =

(01

)Így tehát az r = ρ(A2) = 3-hoz tartozó lineárisan független sajátvektorokszáma sem egy, ami ellentmond Perron tételének.

A3 =

(1 20 0

)Ennek a mátrixnak a sajátértékei a λ1 = 1 és λ2 = 0. Tehát r = ρ(A3) = 1,amelyhez az alábbi sajátvektor tartozik:

x =

(a0

)a ∈ R\{0}

Ekkor akárhogyan is választjuk meg a-t, x biztosan nem lesz pozitív, tehátnem teljesülne a tétel (2.3) pontja, azaz, hogy létezik A3-nak egy x pozitívsajátvektora, amelyre A3x = rx.

A4 =

(0 11 0

)Ennek a mátrixnak a spektrálsugara r = ρ(A) = 1, sajátértékei pedig 1 és−1. Mindkét sajátértékének az abszolút értéke 1 = ρ(A), tehát nem teljesül atétel (2.6) pontja, miszerint r-en kívül nincs A-nak másik olyan sajátértéke,amelynek az abszolút értéke egyenl® r-rel.

25

Page 26: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

3. fejezet

Általánosítás nemnegatívmátrixokra

Láthattuk, hogy Perron tételét nem tudjuk közvetlenül alkalmazni anemnegatív mátrixokra. Frobeniusnak azonban volt egy fontos észrevételeezekkel a mátrixokkal kapcsolatban: nem egyszer¶en az a probléma, hogyegy adott mátrixnak nullelemei is vannak, hanem az, hogy hol helyezkednekel ezek a nullelemek. Nézzük például az alábbi két mátrixot:

A =

(1 01 1

)A =

(1 11 0

)Itt az A mátrixra nem teljesülnek a Perron tétel (2.3) és (2.4) pontjai, de azA mátrixra igen. Továbbá A reducibilis, ugyanis:

P TAP =

(1 10 1

), ahol P =

(0 11 0

)Most vizsgáljuk meg a reducibilitást illetve az irreducibilitást a mátrixokhoz

V1 V2

3.1. ábra. G(A)

tartozó gráfokból kiindulva.

A 3.1 ábrán láthatjuk, hogy azA-hoz tartozó gráf nem er®sen össze-függ®, hiszen nem tudunk irányí-tott úton eljutni V1-b®l V2-be. Így a1.0.14 Tétel alapján láthatjuk, hogyA valóban reducibilis.

26

Page 27: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

3. FEJEZET. ÁLTALÁNOSÍTÁS NEMNEGATÍV MÁTRIXOKRA

V1 V2

3.2. ábra. G(A)

Ugyanakkor a 3.2 ábrán jól lát-ható, hogy az A-hoz tartozó gráf-ban már el tudunk jutni a V1 csúcs-ból a V2 csúcsba irányított úton,így bármely csúcsból bármely má-sik csúcsba vezet irányított út, az-az G(A) er®sen összefügg®, tehát a1.0.14 Tétel alapján A irreducibilis.

Ezek alapján azt remélhetjük, hogy a Perron tétel állításaikiterjeszthet®k nemnegatív mátrixokra is, amennyiben a mátrix irreducibilis.Ennek igazolásához szükségünk lesz az alábbi lemmára, amely megmutatja,hogy hogyan alakíthatunk át egy nemnegatív mátrixot pozitívvá.

3.0.1. Lemma. Ha A ∈ Rn×n egy nemnegatív mátrix és I az n-dimenziósegységmátrix, akkor (I + A)n−1 > 0.

Bizonyítás: Bár a mátrixszorzás nem kommutatív m¶velet, de vegyük észre,hogy mivel IA = AI = A, így az I és A mátrixok esetén teljesül a binomiálistétel, azaz:

(I + A)n−1 =n−1∑k=0

(n− 1

k

)Ak

Elég tehát azt megmutatnunk, hogy az egyenl®ség jobb oldalán szerepl®mátrix minden eleme pozitív. Jelölje az Ak mátrix i-edik sorának j-edikelemét a(k)ij , amely a következ®képpen néz ki:

a(k)ij =

∑1≤h1,...,hk−1≤n

aih1ah1h2 · · · ahk−1j

Vegyük észre, hogy a(k)ij > 0 akkor és csak akkor, ha létezik az indexnek egyolyan h1, . . . , hk−1 sorozata, hogy:

aih1 > 0 és ah1h2 > 0 és . . . és ahk−1j > 0

Ez azt jelenti, hogy létezik az éleknek egy olyan Vi → Vh1 → · · · → Vhk−1→ Vj

k hosszú sorozata G(A)-ban, amely a Vi csúcsból a Vh csúcsba vezet akkorés csak akkor, ha a(k)ij > 0. Mivel A irreducibilis, így G(A) er®sen összefüg-g®, tehát bármely (Vi, Vj) csúcspárra létezik egy k élhosszúságú út, amelyVi-b®l Vj-be vezet (k < n). Ez azt jelenti, hogy minden (i, j) esetén létezik

27

Page 28: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

3. FEJEZET. ÁLTALÁNOSÍTÁS NEMNEGATÍV MÁTRIXOKRA

0 ≤ k ≤ n− 1 úgy, hogy a(k)ij > 0. Ezek alapján:

[(I + A)n−1

]ij=

[n−1∑k=0

(n− 1

k

)Ak

]ij

=n−1∑k=0

(n− 1

k

)a(k)ij > 0

A Perron tétel tehát kiterjeszthet® nemnegatív mátrixokra is abban azesetben, ha feltesszük, hogy a mátrix irreducibilis.

3.0.2. Tétel. (Perron�Frobenius) Ha A ∈ Rn×n egy nemnegatív,irreducibilis mátrix, és r = ρ(A), akkor a következ® állítások teljesülnek:

• r ∈ σ(A). (3.1)

• r egyszeres sajátértéke A-nak. (3.2)

• Létezik egy x > 0 sajátvektora A-nak, amelyre Ax = rx. (3.3)

• r > 0, azaz A spektrálsugara pozitív. (3.4)

• A-nak egyértelm¶en létezik egy olyan p > 0 sajátvektora,

amelyre Ap = rp ésn∑i=1

pi = 1, továbbá A-nak p pozitív

skalárszorosain kívül nem létezik más nemnegatív saját-vektora. (3.5)

• Collatz-Wielandt formula: r = maxx∈N

f(x),

ahol f(x) = min1≤i≤nxi 6=0

[Ax]ixi

és N = {x | x ≥ 0 és x 6= 0} (3.6)

Bizonyítás:

• r ∈ σ(A).Azt, hogy A spektrálsugara egyúttal sajátértéke is A-nak, a következ®állítással együtt fogjuk belátni:

A-nak létezik olyan z ≥ 0, z 6= 0 sajátvektora, amelyre Az = rz.(3.7)

Legyen Ak = A + (1/k)E > 0, ahol E a csupa 1-esekb®l álló mátrix.Jelölje az Ak-hoz tartozó Perron�Frobenius sajátértéket rk > 0, a hozzátartozó Perron vektort pedig pk > 0. Vegyük észre, hogy {pk}∞k=1 egy

28

Page 29: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

3. FEJEZET. ÁLTALÁNOSÍTÁS NEMNEGATÍV MÁTRIXOKRA

korlátos halmaz, ugyanis minden i esetén pi elemeinek az összege 1, aminem teljesülne, ha a halmaz nem lenne korlátos.

A Bolzano-Weierstrass tétel szerint minden korlátos R-ben haladósorozatnak van konvergens részsorozata, amib®l az következik, hogyminden korlátos Rn-ben haladó sorozatnak is van konvergensrészsorozata. Ugyanis ha vesszük el®ször a vektorok els® koordinátáját,az egy korlátos R-ben haladó sorozat, tehát van konvergensrészsorozata. Ezután ha vesszük ezt a konvergens részsorozatot,akkor a vektorok els® koordinátáiban minden további részsorozat iskonvergens marad, és a maradék n−1 koordinátában nézzük a továbbikonvergenciát: ennek az els® (tehát a vektornak eredetileg a második)koordinátája is egy R-ben haladó sorozatot ad, tehát létezik konvergensrészsorozata. Így tehát találunk egy olyan részsorozatot, amely az els®két koordinátájában konvergens. Iterálva találunk olyan részsorozatot,amely már minden koordinátában konvergens, ez pedig épp a vektorokkonvergenciáját jelenti.

Így tehát {pk}∞k=1 is tartalmaz egy konvergens részsorozatot, azazlétezik egy olyan z vektor és léteznek olyan ki indexek, hogy:

{pki}∞i=1 −→ z

Mivel bármely i esetén pki > 0, így z ≥ 0, és mivel ‖pki‖1 = 1, ígyz 6= 0. A (2.21) állítás alapján mivel A1 > A2 > . . . > A ≥ 0, ígyr1 ≥ r2 ≥ . . . ≥ r, azaz {rk}∞k=1 egy korlátos monoton csökken® sorozat,amelynek alsó korlátja r. Ekkor létezik olyan r ≥ r, amelyre:

limk→∞

rk = r

Ekkor az rk-knak tetsz®leges részsorozata is tart r-hoz, tehát speciálisana ki indexekb®l álló részsorozat is:

limi→∞

rki = r ≥ r

Ugyanakkor vegyük �gyelembe a következ®eket:

limk→∞

Ak = A =⇒ limi→∞

Aki = A

Ezek alapján, ha felhasználjuk, hogy véges határértékek esetén aszorzatok határértéke egyenl® a határértékek szorzatával, azt kapjuk,hogy:

Az = limi→∞

Akipki = limi→∞

rkipki = rz =⇒ r ∈ σ(A) =⇒ r ≤ r

29

Page 30: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

3. FEJEZET. ÁLTALÁNOSÍTÁS NEMNEGATÍV MÁTRIXOKRA

Így tehát r = r és Az = rz úgy, hogy z ≥ 0 és z 6= 0. Ezzel tehátbeláttuk a (3.7) állítást és a tétel els® állítását is, azaz, hogy r ∈ σ(A).

• r egyszeres sajátértéke A-nak.Ha egy C mátrixra Cx = λx akkor minden n ∈ N esetén Cnx = λnx.Ez teljes indukcióval könnyen belátható, hiszen az n = 1 eset triviálisés ha feltesszük, hogy n− 1-re már igaz az állítás, akkor:

Cnx = (CCn−1x) = C(Cn−1x) = C(λn−1x) = λn−1Cx = λn−1λx = λnx

Legyen B = (I+A)n−1 > 0, ekkor az el®z®ek alapján λ pontosan akkor(m-szeres) sajátértéke A-nak, ha (1 + λ)n−1 is (m-szeres) sajátértékeB-nek. S®t, ha x a λ-hoz tartozó sajátvektor, az ekvivalens azzal, hogyaz (1+λ)n−1-hez tartozó sajátvektor szintén x. Így tehát ha µ = ρ(B),akkor:

µ = maxλ∈σ(A)

∣∣(1 + λ)n−1∣∣ = max

λ∈σ(A)|(1 + λ)|n−1 =

{maxλ∈σ(A)

|(1 + λ)|}n−1(3.8)

A háromszög egyenl®tlenségb®l tudjuk, hogy |1 + λ| ≤ 1 + |λ|, amib®laz következik, hogy:

maxλ∈σ(A)

|(1 + λ)| ≤ maxλ∈σ(A)

(1 + |λ|) = 1 + maxλ∈σ(A)

|λ| = 1 + r

Ugyanakkor mivel ρ(A) = r és r ∈ σ(A), így a fenti egyenl®tlenségbenλ = r választással egyenl®ség teljesül, amit ha felhasználunk a (3.8)egyenletnél, azt kapjuk, hogy:

µ = · · · ={

maxλ∈σ(A)

|(1 + λ)|}n−1

= (1 + r)n−1

Mivel B pozitív, így alkalmazhatjuk rá a Perron tételt, miszerintµ egyszeres sajátértéke B-nek, amib®l pedig az következik, hogy regyszeres sajátértéke A-nak.

• Létezik egy x > 0 sajátvektor, amelyre Ax = rx.Ahhoz, hogy ezt belássuk, felhasználjuk a (3.7) állítást, azaz,hogy A-nak létezik olyan x nemnegatív sajátvektora, amely az rsajátértékhez tartozik. Mivel Ax = rx ⇐⇒ Bx = (I + A)n−1x =(1 + r)n−1x = µx, így ez az x sajátvektor tartozik µ = ρ(B)-hezis. Viszont mivel B pozitív, így a Perron tétel alapján biztos, hogyx a B-hez tartozó Perron vektornak pozitív többszöröse, amib®l azkövetkezik, hogy x pozitív.

30

Page 31: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

3. FEJEZET. ÁLTALÁNOSÍTÁS NEMNEGATÍV MÁTRIXOKRA

• r > 0, azaz A spektrálsugara pozitív.Mivel A ≥ 0 és x > 0, így Ax > 0. Ha indirekt feltesszük, hogy r = 0,akkor Ax = rx = 0, ami ellentmondás, hiszen Ax > 0. Így tehát biztos,hogy r > 0.

• A tétel (3.5) pontja a Perron vektorról szól, amely ugyanazt mondjaki nemnegatív irreducibilis mátrixokra, mint a Perron tétel a pozitívmátrixokra. A Perron tétel bizonyításánál a Perron vektorról szólóállítások igazolásához nem használtuk ki, hogy A pozitív, így azok abizonyítások itt is érvényesek.

• r = maxx∈N

f(x)

Ahogy a tétel (3.1) pontjának bizonyításánál is, legyen Ak = A+( 1kE),

ahol E a csupa 1-esekb®l álló mátrix, ekkor bármely k esetén Akpozitív. Legyen minden k esetén az Ak-hoz tartozó Perron-Frobeniussajátérték rk, és a hozzá tartozó bal oldali Perron vektor qTk > 0. APerron tétel alapján minden x ∈ N és k > 0 esetén qTk x > 0, és mivel0 ≤ f(x)x ≤ Ax (ezt láthattuk a Perron tétel esetén a Collatz-Wielandtformula bizonyításánál), így:

0 ≤ f(x)x ≤ Ax ≤ Akx =⇒ f(x)x ≤ Akx

Szorozzuk be az egyenl®tlenséget balról qTk -tal:

qTk f(x)x = f(x)qTk x ≤ qTkAkx = rkqTx

Így tehát azt kaptuk, hogy f(x) ≤ rk. A tétel (3.1) pontjánakbizonyításánál már beláttuk, hogy rk −→ r amint k −→ ∞, tehátf(x) ≤ r. Legyen z ∈ N egy olyan vektor, amelyre Az = rz. Ilyenvektor biztos hogy létezik a (3.7) állítás alapján. Ekkor f(z) = r,ugyanis:

f(z) = min1≤i≤nzi 6=0

[Az]izi

= min1≤i≤nzi 6=0

[rz]izi

= min1≤i≤nzi 6=0

rzizi

= r

Így tehát f(z) = r és z ∈ N , amib®l az következik, hogy maxx∈N

f(x) = r.

31

Page 32: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. fejezet

Alkalmazások

A Perron�Frobenius tételt számos területen lehet alkalmazni, ezek közülebben a fejezetben megismerkedhetünk néhány algebrai (primitív mátrixok),illetve sztochasztikai (Markov-láncok), egy közgazdaságtani (Leontief-féleinput-output modell), illetve egy demográ�ai (Leslie-modell egy populációméretének leírására) alkalmazással.

A tételt rangsorok készítésére is kiválóan lehet alkalmazni, példáullabdajátékoknál a csapatok páronkénti összehasonlításával kialakulórangsorhoz, vagy akár egy internetes kereséskor a találatok sorrendjénekfelállításához. Utóbbira a következ® fejezetben láthatunk egy példát,amelyben megismerhetjük a Google keres® m¶ködését és kapcsolatát aPerron�Frobenius tétellel.

4.1. Primitív mátrixok

A primitív mátrixokat a Perron�Frobenius tételben szerepl® egyik fontostulajdonság alapján de�niáljuk.

4.1.1. De�níció. Legyen A ∈ Rn×n egy nemnegatív, irreducibilis mátrix.Ha r = ρ(A) sajátértéke A-nak, de ezen kívül A-nak nincs másik olyansajátértéke, amelynek az abszolút értéke egyenl® r-rel, akkor azt mondjuk,hogy A primitív.

A következ® tétel ugyanazt mondja ki primitív mátrixokra, mint amita 2.2.2 Tétel állít pozitív mátrixokra. Ennek a két tételnek a bizonyításaugyanúgy zajlik, éppen ezért az alábbi tétel bizonyítása nem tartalmazminden lépést, mert azokat már láthattuk a korábbi tétel bizonyítása során.

32

Page 33: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

4.1.2. Tétel. Legyen A egy primitív mátrix, ρ(A) = r, és legyenek az A-hoztartozó jobb és bal oldali Perron vektorok p és qT . Ekkor

limk→∞

(A

r

)k= pqT ,

ahol pqT egy pozitív mátrix és rang(pqT ) = 1.

Bizonyítás: Ha A primitív és ρ(A) = r, akkor r egyszeres sajátértéke A-nak,és a hozzá tartozó p és qT sajátvektorok pozitívak úgy, hogy pT q = 1. Járjunkel ugyanúgy, mint a 2.2.2 Tétel bizonyításánál, és írjuk fel A-t a következ®alakban:

A = S

(r 00 B

)S−1

Ekkor a korábbi bizonyításhoz hasonlóan B-nek minden sajátértéke abszolútértékben kisebb, mint r, tehát itt is elmondható, hogy:

limk→∞

(B

r

)k= 0

Ebb®l pedig (ahogy korábban is láthattuk) már következik a tétel állítása.Az, hogy pqT > 0 és rangja 1, ugyanúgy látható be, mint a 2.2.2 Tételbizonyításánál. �

Frobenius nem csak Perron tételét általánosította a nemnegatívmátrixokra, hanem azt is megmutatta, hogy egy nemnegatív mátrixhatványai meghatározzák, hogy a mátrix primitív-e. Err®l szól az alábbi tétel.

4.1.3. Tétel. Egy nemnegatív A mátrix akkor és csak akkor primitív, halétezik olyan m > 0, amelyre Am > 0.

Bizonyítás: El®ször tegyük fel, hogy A primitív és r = ρ(A). Ekkor a 4.1.2Tétel alapján:

limk→∞

(A

r

)k> 0

Így biztos, hogy létezik olyan m > 0, amelyre

(A

r

)m

> 0, amib®l pedig

következik, hogy Am > 0.

Most nézzük a másik irány bizonyítását, tehát tegyük fel, hogy valamelym > 0-ra Am > 0. Ekkor Am irreducibilis, ugyanis ha reducibilis lenne, azazt jelentené, hogy létezik olyan P permutációs mátrix, amelyre:

A = P

(B C0 D

)P T =⇒ Am = P

(Bm C0 Dm

)P T

33

Page 34: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

Ez viszont nem lehetséges, hiszen Am-nek minden eleme nagyobb, mint nulla.Tegyük fel, hogy A-nak van h darab olyan sajátértéke (λ1, . . . , λh) amelyekreteljesül, hogy:

r = |λ1| = · · · = |λh| > |λh+1| > · · · > |λn|

Mivel λ ∈ σ(A)-ból következik, hogy λm ∈ σ(Am), így ha λ l-szeressajátértéke A-nak, akkor λm is l-szeres sajátértéke Am-nek. (Ez A Jordan-normálalakjából látszik.) Ezek alapján minden 1 ≤ i ≤ h esetén λi és λmimultiplicitása megegyezik, továbbá:

rm = σ(Am) = |λm1 | = · · · = |λmh |

Perron tétele alapján ρ(Am) = rm az egyetlen olyan sajátértéke Am-nek,amelynek az abszolút értéke rm és ennek egyszeres a multiplicitása, teháth = 1 és rm = λm1 . λ1-hez tartozik A-nak egy x sajátvektora, amely ekkorAm-nek az rm-hez tartozó sajátvektora. A Perron tétel alapján feltehet®,hogy ez pozitív, így 0 ≤ Ax = λ1x, ami csak akkor lehet, ha λ1 nemnegatív,és ekkor r = λ1. �

4.2. Leontief-féle input-output modell

Tegyük fel, hogy van egy zárt gazdasági rendszer, amely n különböz®iparágból áll úgy, hogy minden iparág pontosan egy terméket állít el®, ésmindegyik terméket pontosan egy iparág állítja el®, tehát a termékek ésa termelési folyamatok közötti kapcsolat kölcsönösen egyértelm¶. NevezzükJ-egységnek azt, amit a J iparág gyárt és 100 Ft-ért adja el. Például ha azA ipar autókat gyárt, a B pedig ceruzákat, akkor egy A-egységnek megfelelaz autó egy töredékének, de egy B-egység egy csomag ceruzának felel meg.Vezessük be a következ® jelöléseket:

0 ≤ sj := a J iparág által évente gyártott J-egységek száma

0 ≤ aij := egy J-egység el®állításához szükséges I-egységek száma

Így tehát:

aijsj = a J iparág által évente felhasznált I-egységek száman∑j=1

aijsj = az összes iparág által évente felhasznált I-egységek száma

di := a nem ipari célokra évente fennmaradó I-egységek száma

34

Page 35: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

Ekkor tehát:

di = si −n∑j=1

aijsj (4.1)

Jelölje s =(s1 . . . sn

)Ta készlet vektort, azaz, hogy az egyes termékekb®l

évente mennyit állítanak el®, és jelölje az iparok által nem felhasznált(kereskedelmi célokra megmaradó) termékek mennyiségét a d =

(d1 . . . dn

)Tkereskedelmi vektor. Azt szeretnénk kiszámolni, hogy egy adott kereskedelmivektorhoz milyen készlet vektorra van szükségünk. Tehát a feladatunk az,hogy egy adott d ≥ 0 esetén kiszámítsuk az s ≥ 0 vektort.

Els® ránézésre a feladat egyszer¶nek t¶nhet, hiszen a (4.1) egyenletetfelírhatjuk (I − A)s = d alakban, és így ha (I − A) invertálható, akkors = (I − A)−1d. Ezzel azonban az a probléma, hogy annak ellenére, hogyA egy nemnegatív mátrix, a kapott s vektornak lehetnek negatív elemei is,pedig mi olyan készlet vektort szeretnénk kiszámolni, amely nemnegatív.

Ebben a modellben fontos azonban, hogy az egyes iparágak szorosösszefüggésben állnak egymással, pontosabban: minden egyes termékre �közvetve vagy közvetlenül ugyan � de mindenképp szükségünk van ahhoz,hogy a gazdasági rendszer összes termékét el®állítsuk. Ez matematikailag aztjelenti, hogy ha az aij számokat felírjuk egy közös A mátrixba, akkor a hozzátartozó G(A) gráf er®sen összefügg® lesz, és így a 1.0.14 Tétel alapján az Amátrix irreducibilis.

Ha az A mátrix j-edik oszlopának elemeit összegezzük, akkor megkapjukazt a mennyiséget, amely megmutatja, hogy összesen hány egységre vanszükségünk egy J-egység el®állításához. Azonban vegyük �gyelembe, hogyaz egyes egységek 100 Ft-ba kerülnek, tehát:

cij =n∑i=1

aij = hány egység kell egy J-egység el®állításához

= hányszor 100 Ft-ot költünk el egy J-egység el®állítására

Mivel az el®állított J-egységet 100 Ft-ért tudjuk eladni, így értelemszer¶enazt szeretnénk, hogy az el®állítása ne kerüljön többe, mint amennyiérteladjuk. Tehát egy jó gazdasági rendszerben minden j-re cj ≤ 1 és léteziklegalább egy olyan iparág (legyen ez az I), amelyre ci < 1 (különben azegész rendszer nem termelne hasznot). Ekkor A oszlopait ki tudjuk úgyegészíteni, hogy mindegyik oszlopösszeg pontosan 1 legyen, azaz létezik egyolyan nemnegatív E mátrix, hogy E 6= 0 és az A + E mátrix mindenoszlopának összege egyenl® 1-gyel. Ekkor ha e egy olyan vektor, amelynekmindene eleme 1, akkor a következ® teljesül:

35

Page 36: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

eT (A+ E) = eT

Tegyük fel, hogy ρ(A) ≥ 1, és legyen az A-hoz tartozó jobb oldali Perronvektor p, ekkor az eTp szorzat a p vektor elemeinek az összegét jelenti, ami aPerron�Frobenius tétel alapján 1-gyel egyenl®, így az el®z® egyenlet alapjánfelírhatjuk a következ® egyenletet:

1 = eTp = eT (A+ E)p = eT (Ap) + eT (Ep) = eT (ρ(A)p) + eT (Ep)

= ρ(A)(eTp) + eT (Ep) = ρ(A) + eT (Ep) (4.2)

Mivel E ≥ 0, E 6= 0 és p > 0, így Ep > 0, tehát az Ep vektor elemeinekaz összege is pozitív, azaz eT (Ep) > 0, amit ha felhasználunk a (4.2)egyenletben, akkor a következ®t kapjuk:

1 = . . . = ρ(A) + eT (Ep) ≥ 1 + eT (Ep) > 1

Ez pedig ellentmondás, tehát nem igaz, hogy ρ(A) ≥ 1, tehát biztos, hogyρ(A) < 1. Most pedig bizonyítás nélkül fel fogjuk használni a következ® tételt.

4.2.1. Tétel. Ha A ∈ Cn×n, akkor a következ® állítások ekvivalensek:

•∞∑k=0

Ak konvergens

• ρ(A) < 1

• limk→∞

Ak = 0

Ekkor létezik az (I − A)−1 mátrix és∞∑k=0

Ak = (I − A)−1.

Emlékezzünk vissza, hogy a 3.0.1 Lemma bizonyításakor beláttuk, hogy haaz Ak mátrix i-edik sorának j-edik elemét a(k)ij jelöli, akkor ha A irreducibilis,biztos, hogy minden i és j indexhez létezik olyan 1 ≤ k ≤ n − 1, amelyrea(k)ij > 0, ebb®l pedig az következik, hogy

∑k A

k > 0, tehát (I − A)−1 egypozitív mátrix.

Ezek alapján pedig minden d ≥ 0 kereskedelmi vektorhoz egyértelm¶enlétezik egy s > 0 készlet vektor, amelyet az s = (I−A)−1d egyenlettel tudunkkiszámolni, így tehát megsz¶nt az eredetileg felvetett probléma.

Van még egy érdekes következménye is annak, hogy az (I−A)−1 mátrixés az s vektor is pozitív: ha a d vektornak egyetlen elemét megnöveljük, az azteredményezi, hogy s-nek minden eleme növekedni fog. Ez pedig azt jelenti,hogy ha akár csak egyetlen iparág egyetlen termékéb®l többet szeretnénka kereskedelemben forgalmazni, az hatással lesz az egész gazdaságra, ésszükségképpen minden iparág termékéb®l többet kell gyártani.

36

Page 37: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

4.3. Leslie-modell

Osszuk fel a népesség n®i populációját n darab korosztályra (jelöljeezeketG1, . . . , Gn) úgy, hogy az egyes korosztályok 10 éves id®intervallumokatalkossanak, tehát:

G1 = a 10 év alatti lányok csoportja

G2 = a 10-19 év közötti lányok csoportja

G3 = a 20-29 év közötti n®k csoportja

stb.

Tekintsünk az id®ben diszkrét pontokat, legyenek ezek t = 0, 1, 2, . . .évtizedek. (A modellben az intervallumok egységénél nem fontos, hogyévtizedeket vegyünk, csak arra kell �gyelni, hogy az egyes korosztályokazonos nagyságú id®intervallumokat alkossanak, és hogy t is az intervallumoknagyságával azonos értékeket vegyen fel. Például ha a korosztályokat 15 évesid®intervallumokra osztjuk, akkor t = 0 · 15, 1 · 15, . . . éveket jelent.)Jelölje bk a szülési-, sk pedig a túlélési rátát a Gk korcsoportban, azaz:

bk = a Gk csoportbeli n®kt®l id®egység alatt született lányok

várható száma

sk = azon n®k száma, akik a t-edik évtizedben a Gk csoportban

vannak, a (t+ 1)-edik évtizedben pedig Gk+1-ben

A túlélési ráta tehát azt méri, hogy hány olyan n® van, aki megéli azt, hogyegy adott korosztályból átkerül a következ® korosztályba.

Jelölje fk(t) a Gk-beli n®k számát a t-edik évtizedben, ekkor a következ®egyenl®ségek teljesülnek:

f1(t+ 1) = f1(t)b1 + f2(t)b2 + · · ·+ fn(t)bn

fk(t+ 1) = fk−1(t)sk−1 k = 2, 3, . . . , n(4.3)

Jelöljük Fk(t)-vel azt, hogy a t-edik évtizedben a Gk csoport hány százalékátteszi ki a teljes populációnak:

Fk(t) =fk(t)

f1(t) + · · ·+ fn(t)

Ekkor az F (t) =(F1(t) . . . Fn(t)

)Tvektor fejezi ki a populáció

életkor-eloszlását a t-edik évtizedben, és (amennyiben létezik) F := limt→∞

F (t)

pedig a hosszútávú életkor-eloszlást.

37

Page 38: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

Most azt fogjuk megmutatni, hogy ha s1, . . . , sn−1 illetve b2, . . . , bnis pozitívak, akkor létezik ez az F határérték, és ki is számítjuk azértékét. A (4.3) egyenletek egy lineáris egyenletrendszert alkotnak, amelyaz f(t) =

(f1(t) · · · fn(t)

)Tjelölés bevezetésével felírható a következ®

mátrixos alakban:

f(t+ 1) = Lf(t), ahol L =

b1 b2 · · · bn−1 bns1 0 · · · · · · 00 s2 0 · · · 0...

. . . . . ....

0 0 · · · sn−1 0

∈ Rn×n

Ezt az L mátrixot P. H. Leslie tiszteletére Leslie-mátrixnak nevezzük, mivelezt a modellt ® dolgozta ki 1945-ben.

Gondoljuk végig, hogy hogyan is néz ki ehhez az L-hez tartozó G(L)gráf: az els® csúcsból minden további csúcsba vezet él, továbbá minden i-edikcsúcsból vezet él az i− 1-edik csúcsba. Így bármely csúcsból bármely másikcsúcsba el tudunk jutni irányított úton, tehát G(L) er®sen összefügg®, így a1.0.14 Tétel alapján L irreducibilis. Viszont ez a G(L) gráf szemléletesen aztmutatja nekünk, hogy egy adott korosztályba melyik másik korosztályokbólkerültek át az emberek, tehát a forrásokat ábrázolja. Éppen ezért, haszemléletesen szeretnénk ábrázolni (azaz hogyha azt szeretnénk mutatni,hogy egy adott korcsoport mely más csoportok növekedéséhez járul hozzá),akkor el®ször transzponálni kell a Leslie-mátrixot, és az így kapott LT -hoztartozó gráfot érdemes tekinteni.

Az alábbiakban láthatunk egy példát, hogy n = 6 esetén hogyan néz kia G(LT ) gráf, amennyiben b1 = 0 (ha b1 is pozitív, akkor az els® csúcsbólvezet még egy hurokél is önmagába).

1 6

2 5

3 4

4.1. ábra. n = 6 esetén a transzponált Leslie-mátrixhoz tartozó gráf

38

Page 39: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

4.3.1. Állítás. Ha L egy n× n méret¶ Leslie-mátrix, akkor Ln+2 > 0.

Bizonyítás: Vegyük észre, hogy L és a G(L) adjacencia mátrixa (jelölje eztG) eléggé hasonlítanak egymásra abban az értelemben, hogy lij pontosanakkor nulla, ha gij is nulla, és ahol lij pozitív, ott gij = 1. Így tehát Ln+2 > 0pontosan akkor, ha Gn+2 > 0. Viszont egy gráf adjacencia mátrixánakhatványozása megadja, hogy tetsz®leges csúcsból egy másik csúcsba hánykülönböz®, adott hosszúságú úton (vagy sétán) tudunk eljutni.

Tehát Gn+2 > 0 azzal ekvivalens, hogy G(L)-ben bármely csúcsbólbármely másik csúcsba el tudunk jutni pontosan n+ 2 élhosszúságú sétával.Ez könnyen látható, hiszen ha az i-edik csúcsból szeretnénk eljutni a j-edikcsúcsba, akkor elindulunk i-b®l a G(L)-ben található irányított kör menténaz 1-es csúcshoz, majd onnan közvetlenül átmegyünk az (j − i + 2)-edikcsúcsba, ahonnan az irányított kör mentén ismét elmegyünk a j-edik csúcsba.Az alábbi ábra mutatja, hogy az említett csúcsok között milyen hosszúságúutakat teszünk meg:

i 1 j − i+ 2 ji− 1 1 n− i+ 2

4.2. ábra. A csúcsok közti utak élhosszúságai

Ilyen módon tehát bármely i csúcsból el tudunk jutni bármely j csúcsba.(Kivétel a j = i− 1 eset, ilyenkor ugyanis j − i + 2 = 1, ahová nem tudunkegy 1 élhosszúságú úton eljutni az els® csúcsból, azonban ebben az esetben isbelátható, hogy létezik n+2 élhosszúságú séta.) Így a séta élhossza összesen:

i− 1 + 1 + n− i+ 2 = n+ 2

Ezzel tehát beláttuk, hogy Gn+2 > 0, és így Ln+2 > 0. �

A 4.1.3 Tétel alapján így L primitív, ezért alkalmazhatjuk a 4.1.2 tételt,tehát ha r a Leslie-mátrix Perron�Frobenius sajátértéke, és a hozzá tartozójobb és bal oldali Perron vektorok p és qT , akkor:

limt→∞

Lt

rt= pqT (4.4)

Mivel f(t + 1) = Lf(t), így minden t esetén f(t) kifejezhet® az L mátrix ésf(0) segítségével:

f(t) = Lf(t− 1) = L (Lf(t− 2)) = · · · = Ltf(0)

39

Page 40: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

Feltehet®, hogy f(0) 6= 0 (ugyanis f(0) = 0 azt jelentené, hogy a 0. évtizedbenegyik korcsoportban se volt egyetlen n® sem), így ha beszorozzuk ezzel azf(0)-lal a (4.4) egyenletet jobbról, akkor a következ®t kapjuk:

limt→∞

f(t)

rt= lim

t→∞

Ltf(0)

rt= pqTf(0) (4.5)

Fontos megjegyeznünk, hogy a qTf(0) szorzat egyenl® a q és f(0)vektorok skaláris szorzatával, ami q pozitivitása miatt biztos, hogy egypozitív szám, tehát qTf(0) = α valamely pozitív α skalár esetén, ésígy a következ®t írhatjuk fel:

limt→∞

∥∥∥∥f(t)rt∥∥∥∥1

=

∥∥∥∥ limt→∞ f(t)

rt

∥∥∥∥1

=∥∥pqTf(0)∥∥

1= ‖pα‖1 = α ‖p‖1 = α ·1 = α > 0

Vegyük észre, hogy Fk(t)-t ki tudjuk fejezni ‖f(t)‖1 segítségével, és így F (t)is felírható ‖f(t)‖1 segítségével:

Fk(t) =fk(t)

f1(t) + · · ·+ fn(t)=

fk(t)

‖f(t)‖1=⇒ F (t) =

f(t)

‖f(t)‖1

Ezek alapján pedig a következ®eket írhatjuk fel:

F = limt→∞

F (t) = limt→∞

f(t)

‖f(t)‖1= lim

t→∞

f(t)/rt

‖f(t)‖1 /rt

= limt→∞

f(t)/rt

‖f(t)/rt‖1=

limt→∞

f(t)/rt

limt→∞‖f(t)/rt‖1

=pα

α= p

Tehát F megegyezik a Leslie-mátrixhoz tartozó p Perron vektorral, és ezazt jelenti, hogy az id® el®rehaladtával az egyes korosztályokban lév® n®klétszámainak az aránya egy stabil állapothoz konvergál. A hosszútávú életkor-eloszlást az L-hez tartozó Perron vektor adja meg, és mivel ez a p vektorpozitív, így minden korosztály valamely pozitív hányadosát teszi ki a teljesnépességnek.

Érdekes észrevétel, hogy bár t −→∞ esetén a korcsoportok létszámánakaránya állandó lesz, ennek ellenére az egyes csoportokban a n®k létszámanövekedhet és csökkenhet is, r értékét®l függ®en:

• Ha r < 1, akkor a (2.12) állítás alapján f(t) = Ltf(0) −→ 0 · f(0) = 0.

• Ha r = 1, akkor ezt a (4.5) egyenletbe behelyettesítve azt kapjuk, hogyf(t) −→ pqTf(0) = pα > 0.

40

Page 41: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

• Ha r > 1, akkor a (2.12) állítás bizonyításánál található gondolat-menet alapján létezik olyan ε > 0 és N ∈ N, hogy minden t ≥ N esetén‖Lt‖∞ > (1 + ε)t −→∞, és mivel f(t) = Ltf(0), így minden k eseténfk(t) −→∞.

41

Page 42: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

4.4. Markov-láncok

Ahogy Meyer írja [1, 687. oldal 1. sor]: �a Perron�Frobenius tétel egyiklegelegánsabb alkalmazása a véges Markov-láncok algebrai vizsgálata�. Mostmegismerkedhetünk a Markov-láncokhoz kapcsolódó alapvet® fogalmakkal,és láthatjuk, hogy ezek milyen összefüggésben állnak a Perron�Frobeniustétellel.

4.4.1. De�níció. Legyen P ∈ Rn×n egy nemnegatív mátrix, ekkor aztmondjuk, hogy P sztochasztikus, ha a mátrix minden sorában az elemekösszege 1-gyel egyenl®.

4.4.2. Tétel. Legyen A ∈ Rn×n egy nemnegatív, irreducibilis mátrix, éslegyen ρ(A) = r. Ekkor A hasonló egy rP mátrixhoz, ahol P egy irreducibilissztochasztikus mátrix.

Bizonyítás: Legyen D ∈ Rn×n egy olyan mátrix, amelynek a f®átlójábanaz A-hoz tartozó p Perron vektor elemei vannak, azon kívül pedig nullák:

D =

p1 0. . .

0 pn

Legyen e egy csupa 1-esekb®l álló vektor, így mivel D−1 f®átlójában a pielemek reciprokai vannak, ekkor a következ® egyenl®ség teljesül:

D−1ADe = D−1Ap = D−1rp = rD−1p = re

Ez azt jelenti, hogy a D−1AD mátrix minden sorában az elemek összege r-relegyenl®. A Perron�Frobenius tétel alapján r > 0, így beszorozhatunk r−1-el,tehát legyen P = r−1D−1AD. Ekkor P minden sorösszege 1-gyel egyenl®,tehát P sztochasztikus, továbbá rP = D−1AD hasonló A-hoz. Abból, hogyA irreducibilis, az következik, hogy P is irreducibilis, így tehát beláttuk atétel állítását. �

4.4.3. De�níció. Legyen X0, X1, . . . valószín¶ségi változóknak egy sorozataúgy, hogy mindegyik Xt a lehetséges állapotoknak ugyanabból az{S1, . . . , Sn} halmazából való. Ekkor azt mondjuk, hogy {Xt}∞t=0 egysztochasztikus folyamat.

42

Page 43: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

4.4.4. De�níció. Egy folyamat Markov-tulajdonságú, ha a (t+ 1)-edik id®-pillanatbeli állapot valószín¶sége csak a t-edik id®pontbeli állapottól függ, azazel®ttiekt®l pedig független, azaz bármely t esetén:

P (Xt+1 = Sj | Xt = Sit , . . . , X0 = Si0) = P (Xt+1 = Sj | Xt = Sit)

4.4.5. De�níció. A Markov-tulajdonságú sztochasztikus folyamatokatMarkov-láncoknak nevezzük.

A Markov-láncokra tehát tekinthetünk úgy, mint véletlen állapotoknakegy sorozatára a t = 0, 1, 2, . . . diszkrét id®pontokban, ahol Xt írja le a t-edikid®pontbeli állapotot. Például képzeljünk el egy udvart, amelyet kerítésekkelelkülönítettünk n különböz® részre (úgy, hogy az egyes udvarrészek közöttvannak kapuk, amelyek biztosítják az átjárást), és ebben az udvarban egykutya véletlenszer¶en sétál. Ekkor Si azt jelenti, hogy a kutya az i-edikudvarrészen tartózkodik éppen, és Xt írja le, hogy a kutya a t id®pontbanmelyik udvarrészen van. Ekkor tehát a kutya mozgása Markov-tulajdonságú,ha a következ® lépése csak az aktuális helyzetét®l függ, és nem számít, hogykorábban az udvarnak melyik részein járt.

Minden Markov-lánc meghatároz egy sztochasztikus mátrixot, és ezfordítva is igaz.

4.4.6. De�níció. Jelölje pij(t) azt a valószín¶séget, hogy a t id®pontban azSj állapotban vagyunk, feltéve, hogy a t − 1 id®pontban az Si állapotbanvoltunk, azaz: pij(t) = P (Xt = Sj | Xt−1 = Si). Ekkor azt mondjuk, hogy pijaz átmenet-valószín¶sége annak, hogy a t id®pontban az Si állapotból az Sjállapotba kerülünk.

Ha ezeket az átmenet-valószín¶ségeket felírjuk egy P (t) ∈ Rn×n mátrixba(ahol tehát a mátrix i-edik sorának j-edik eleme pij(t)-vel egyenl®), akkorP (t) nyilván nemnegatív. Mivel a mátrix i-edik sora olyan számokattartalmaz, amelyek megmutatják, hogy egy adott j állapotba mekkoravalószín¶ségekkel kerülhetünk ebb®l az i állapotból, ezért ezeknek avalószín¶ségeknek az összege triviálisan 1-gyel egyenl®. Így P (t) mindensorában az elemek összege 1, tehát P (t) sztochasztikus.

4.4.7. De�níció. Azt mondjuk, hogy egy Markov-lánc stacionáriusátmenetvalószín¶ség¶ (vagy más néven homogén), ha az átmenet-valószín¶ségek t-t®l függetlenek, azaz pij(t) = pij minden t esetén. EkkorP (t) egy konstans mátrix, amelyet átmenet-mátrixnak nevezünk.

43

Page 44: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

Így tehát minden Markov-lánc meghatároz egy P sztochasztikusmátrixot. Ugyanakkor, ha P egy n× n méret¶ sztochasztikus mátrix, akkora pij elemekre tekinthetünk úgy, mint egy n elem¶ állapothalmazhoz tartozóátmenet-valószín¶ségekre, amelyek meghatároznak egy stacionárius Markov-láncot.

4.4.8. De�níció. Ha p ∈ Rn egy olyan nemnegatív vektor, amely elemeinekösszege 1, akkor azt mondjuk, hogy p egy valószín¶ségi eloszlás-vektor.Például egy sztochasztikus mátrixnak minden sora ilyen vektor.

Egy olyan Markov-lánc esetén, amelynek az állapotterében n állapotvan, a k-adik lépés valószín¶ségi eloszlás-vektorán a következ® vektort értjük:

p(k) =(p1(k) . . . pn(k)

)Tk = 1, 2, . . . , ahol pj(k) = P (Xk = Sj)

A kezdeti eloszlás-vektor pedig a következ®:

p(0) =(p1(0) . . . pn(0)

)T, ahol pj(0) = P (X0 = Sj)

Ekkor tehát pj(k) annak a valószín¶sége, hogy a k-adik lépés után (de méga (k + 1)-edik lépés el®tt) a j-edik állapotban vagyunk (azaz Sj-ben), pj(0)pedig annak a valószín¶sége, hogy a folyamat az Sj állapotból indul.

S1 S2

S3

4.3. ábra

Térjünk most vissza a kertben sétá-ló kutya példájához. Osszuk fel a kerteta 4.3 ábrán látható módon, és tegyük fel,hogy a kutyát minden t id®pontban arrautasítjuk, hogy az aktuális udvarrészr®lmenjen át egy másikra, de azt ® dönti elvéletlenszer¶en, hogy hová megy tovább.

Ha a kutyát kezdetben a harmadikudvarrészbe engedjük be, akkor a kez-deti eloszlás-vektor p(0) =

(0 0 1

)T.

Viszont ha például úgy indítjuk el a fo-lyamatot, hogy kezdetben feldobunk egylabdát a kert fölött, majd ahová az le-esik, a kutyát kezdetben arra az udvarrészbe engedjük be, akkor a kezdetieloszlás-vektor p(0) =

(1/4 1/4 1/2

)Tlesz, mivel az egyes udvarrészek te-

rületei ekkora részeit teszik ki a teljes udvarnak. Ennél a példánál a Markov-lánchoz tartozó átmenet-mátrix a következ® lesz:

M =

0 1/2 1/21/3 0 2/31/3 2/3 0

44

Page 45: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

Ekkor σ(M) = {1,−1/3,−2/3}, tehát M egy olyan nemnegatív mátrix,amelyre ρ(M) = 1. Ez viszont nem véletlen, hiszen ha P egy tetsz®legessztochasztikus mátrix, akkor ‖P‖∞ = 1, és ha e pedig a csupa 1-esekb®lálló vektor, akkor Pe = e, tehát e sajátvektora P -nek és a hozzá tartozósajátérték 1. Most használjuk fel azt, hogy az alábbi egyenl®ség bármely Amátrixra igaz tetsz®leges mátrixnorma esetén:

∀λ ∈ σ(A) : |λ| ≤ ‖A‖ (4.6)

Ez könnyen látható, hiszen ha például a λ-hoz tartozó sajátvektor x, akkorlegyen X ∈ Rn×n egy olyan mátrix, amelynek az els® osztlopában x áll, azösszes többi eleme pedig nulla. Ekkor λX = AX, amib®l az következik, hogy|λ| ‖X‖ = ‖λX‖ = ‖AX‖ ≤ ‖A‖ ‖X‖, ebb®l pedig már következik, hogy|λ| ≤ ‖A‖.

Így tehát a (4.6) egyenl®tlenség alapján:

1 ≤ ρ(P ) ≤ ‖P‖∞ = 1 =⇒ ρ(P ) = 1

Tehát bármely P sztochasztikus mátrix spektrálsugara 1-gyel egyenl®, ése > 0 egy hozzá tartozó sajátvektor.

Most láthatunk egy lemmát, amely p(0) segítségével megad egy explicitképletet p(k)-ra.

4.4.9. Lemma. Legyen P egy irreducibilis átmenet-mátrixa egy olyanMarkov-láncnak, amelynek a lehetséges állapotai {S1, . . . , Sn}. Ekkor bármelyp(0) kezdeti eloszlás-vektor esetén a k-adik lépés valószín¶ségi eloszlás-vektoraaz a p(k) vektor, amelyre pT (k) = pT (0)P k.

Vezessük be a következ® jelöléseket: legyen a P k mátrix i-edik sorának j-edik eleme p(k)ij , jelölje ei az i-edik egységvektort (azaz azt a vektort, amelyneki-edik eleme 1 és az összes többi 0), valamint legyen a p(k) vektor j-edik elemepj(k). Ekkor ha p(0) = ei, akkor az el®z® tétel alapján p(k) = eiP

k, azaza p(k) vektor megegyezik a P k mátrix i-edik sorával. Ekkor tehát minden1 ≤ i ≤ n esetén pj(k) = p

(k)ij , ami azt jelenti, hogy a P k mátrix i-edik

sorának j-edik eleme megmutatja, hogy mekkora a valószín¶sége annak,hogy az Si állapotból pontosan k lépéssel az Sj állapotba jutunk. Ezért aztmondjuk, hogy a P k mátrix a k-adik lépés átmenet-mátrixa.

Most térjünk vissza a 4.3 ábrán látható kertben sétáló kutya példájához,és ahogy korábban feltettük, legyen véletlenszer¶, hogy a kutya kezdetben

45

Page 46: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

4. FEJEZET. ALKALMAZÁSOK

honnan indul, tehát legyen p(0) =(1/4 1/4 1/2

)T. Nézzük meg, hogy mi

lesz például a 3., 8., 50., illetve 51. lépés eloszlás-vektora:

p(3) =(0, 25 0, 4120 0, 3380

)Tp(8) =

(0, 25 0, 3701 0, 3799

)Tp(50) =

(0, 25 0, 3750 0, 3750

)Tp(51) =

(0, 25 0, 3750 0, 3750

)TEz tehát azt jelenti, hogy például annak a valószín¶sége, hogy a kutya a 8.lépés után a második udvarrészben van: p2(8) = 0, 3701.

Láthatjuk, hogy p(50) = p(51), így mivel a 4.4.9 Lemma alapjánp(k) = p(k − 1)M , így minden további k ≥ 50 esetén p(k) = p(50) lesz,tehát jelen esetben az eloszlás-vektorok konvergensek. Ez azt jelenti, hogy hahosszútávon vizsgáljuk a folyamatot, akkor az id® 25%-ában a kutya az els®udvarrészben tartózkodik, míg a másodikban illetve harmadikban egyarántaz id® 37,5%-át tölti.

Az ilyen konvergencia általánosan is teljesül primitív mátrixok esetén,err®l szól a következ® tétel.

4.4.10. Tétel. Ha egy Markov-lánchoz tartozó P átmeneti-mátrix primitív,amelynek a bal oldali Perron vektorát πT jelöli és e-vel jelöljük a csupa 1-esekb®l álló vektort, akkor a következ®k teljesülnek:

limk→∞

P k = eπT és limk→∞

pT (k) = πT

Bizonyítás: Mivel P egy sztochasztikus mátrix, így a hozzá tartozó jobboldali Perron vektor a csupa 1-esekb®l álló e vektor. Ekkor a 4.1.2 Tételalapján mivel r = ρ(P ) = 1, így:

limk→∞

P k = limk→∞

(P

r

)k= eπT

Az, hogy a p(k) vektorok π-hez konvergálnak, könnyen látható, hafelhasználjuk a 4.4.9 Lemmát, miszerint pT (k) = pT (0)P k:

limk→∞

pT (k) = limk→∞

pT (0)P k = pT (0) limk→∞

P k = pT (0)eπT = πT

Itt az utolsó egyenl®ség azért teljesül, mert a pT (0)e szorzat azt jelenti,hogy a p(0) vektor elemeit összeadjuk, és tudjuk, hogy ez az összeg 1, így(pT (0)e)πT = 1 · πT = πT . �

A tételben szerepl® πT vektort stacionárius eloszlás-vektornak, vagyröviden stacionárius vektornak nevezzük, hiszen ez az a vektor, amelyreπTP = πT teljesül.

46

Page 47: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. fejezet

Google PageRank

A Perron�Frobenius tételnek fontos szerepe van a Google keres®m¶ködésében. A Google az úgynevezett PageRank algoritmussal határozzameg, hogy egy-egy kereséskor mely weboldalak jelenjenek meg els®ként atalálatok között. Ezt az algoritmust Larry Page és Sergey Brin (a Googlealapítói) dolgozták ki 1998-ban. Ahhoz, hogy megértsük a Perron�Frobeniustétel és a Google PageRank közötti összefüggést, érdemes el®ször azalgoritmus felépítésével foglalkozni.

5.1. A weboldalak reprezentációja

Ahhoz, hogy valamilyen fontossági sorrendet tudjunk felállítani az egyeshonlapok között, ábrázolnunk kell ®ket matematikailag, ami a következ®módon történik: képzeljük el, hogy az egyes weboldalak egy gráf csúcsai, ésegy A csúcsból akkor megy (irányított) él egy B csúcsba, ha az A honlaphivatkozik a B-re. Ezáltal az interneten található weboldalak összességefelírható egy irányított grá�al.

A weboldalak sorrendbe állításához szükséges, hogy legyen egy olyantulajdonságuk, ami alapján rendezni tudjuk ®ket: ez az adott honlap rangja.Ez az egyes oldalak hivatkozásaiból áll el®: ha egy weboldalra nagyonsok oldal hivatkozik, akkor nagyobb lesz a rangja, mint egy olyan oldalé,amelyikre kevés oldal hivatkozik. Fontos viszont, hogy a weboldal, ahonnanaz adott honlapra érkezik a hivatkozás, milyen ranggal rendelkezik, ugyanisa nagyobb rangú oldalakról érkez® hivatkozások fontosabbak, mint a kisebbrangúaké. Ugyanakkor az is számít, hogy egy-egy oldalból hány hivatkozásvezet más honlapokra: ha adott két ugyanolyan ranggal rendelkez® weboldal,

47

Page 48: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

ahol az egyik jóval több oldalra hivatkozik, mint a másik, akkor ez utóbbihivatkozásai számítanak értékesebbnek.

Röviden összefoglalva, a PageRank algoritmusban egy weboldal annálfontosabb, minél fontosabb oldalak hivatkoznak rá.

5.2. Matematikai felépítés

Brin és Page kezdetben az alábbi nagyon egyszer¶ egyenlettel határoztákmeg az egyes oldalak rangjait. Jelölje az i-edik weboldalt Pi, a rangját pedigr(Pi), ami a Pi-re mutató összes honlap rangjainak az összege:

r(Pi) =∑

Pi∈BPi

r(Pj)

|Pj|(5.1)

Itt BPiazt a halmazt jelöli, amelyben azok a honlapok találhatóak, amelyek

hivatkoznak Pi-re, |Pj| pedig a Pj oldalból kimen® hivatkozások száma. Aprobléma viszont ezzel az (5.1) egyenlettel az, hogy a Pi-re hivatkozó Pjoldalak rangjait nem tudjuk, így az r(Pj)-k ismeretlenek. Ezt viszont egyiterációval könnyen ki lehet küszöbölni: kezdetben minden oldal rangja 1/n(ahol n a weboldalak száma), és így alkalmazzuk az (5.1) egyenletet többszöregymás után. Jelölje rk+1(Pi) a Pi oldal rangját a k+1. iterációnál. Így tehát:

rk+1(Pi) =∑

Pi∈BPi

rk(Pj)

|Pj|(5.2)

Itt r0(Pi) = 1/n minden Pi esetén, és az iterációt addig ismételjük, amíg azoldalak rangjai valamely végs® értékhez konvergálnak.

Az alábbiakban egy példát láthatunk egy olyan gráfra, amely 6weboldalt ábrázol, majd láthatjuk, hogy az (5.2) egyenletet alkalmazvahogyan alakulnak az oldalak rangjai néhány iteráció után.

P3

P1 P4

P2 P5

P6

5.1. ábra. 6 weboldalt ábrázoló irányított gráf

48

Page 49: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

Kezdeti érték 1. iteráció 2. iteráció Rangsor a 2. iteráció utánr0(P1) = 1/6 r1(P1) = 1/18 r2(P1) = 1/36 5.r0(P2) = 1/6 r1(P2) = 5/36 r2(P2) = 1/18 4.r0(P3) = 1/6 r1(P3) = 1/12 r2(P3) = 1/36 5.r0(P4) = 1/6 r1(P4) = 5/36 r2(P4) = 11/72 3.r0(P5) = 1/6 r1(P5) = 1/4 r2(P5) = 17/72 1.r0(P6) = 1/6 r1(P6) = 1/6 r2(P6) = 14/72 2.

5.1. táblázat. Az oldalak rangjai az els® két iteráció során

5.2.1. A feladat mátrix reprezentációja

Az (5.1) és (5.2) egyenletekkel egyszerre csak egy oldal rangjáttudjuk kiszámolni. Mátrixok segítségével viszont ki tudunk számítani egyn hosszú PageRank vektort, amelynek i-edik eleme a Pi oldal rangja. Ehhezbevezetünk egy H ∈ Rn×n mátrixot és egy πT ∈ R1×n sorvektort, ahol:

Hij =

1

|Pi|ha Pi-b®l Pj-be vezet él

0 különben

H nagyon hasonlít a gráf adjacencia mátrixához, csak itt a nemnullaelemek nem 1-esek, hanem valószín¶ségek: Hij megmutatja, hogy mekkoravalószín¶séggel jutunk el Pi-b®l Pj-be. Az 5.1 ábrán látható gráfhoz tartozóH mátrix a következ®képpen néz ki:

H =

P1 P2 P3 P4 P5 P6

P1 0 1/2 1/2 0 0 0P2 0 0 0 0 0 0P3 1/3 1/3 0 1/3 0 0P4 0 0 0 0 1/2 1/2P5 0 0 0 1/2 0 1/2P6 0 0 0 0 1 0

Legyen π(k)T a PageRank vektor a k-adik iteráció után, és legyen

π(0)T =(1/n . . . 1/n

). Ekkor az (5.2) egyenlet a következ® módon írható

fel:

π(k+1)T = π(k)TH (5.3)

Ez az iteráció egy n×n-es mátrix esetén O(n2) m¶veletet igényelne, de mivelH egy elég ritka mátrix, így a gyakorlatban sokkal könnyebben számolhatunk

49

Page 50: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

vele, ha csak a nemnulla elemeit és azok elhelyezkedését tároljuk. Becslésekalapján egy weboldal átlagosan 10 másik oldalra hivatkozik, tehát egyn × n-es mátrixnak körülbelül 10n nemnulla eleme van, és ezzel az iterációm¶veletigénye O(n)-re csökkenthet®.

5.3. Az iteráció problémái

Az iteráció eddig felépített változatával még sok a probléma. Példáulvegyük azokat az oldalakat, amelyekb®l egyetlen él sem megy ki.

P3

P1 P2

5.2. ábra

Ezek az oldalak minden egyes iterációkoregyre több PageRanket gy¶jtenek össze,és így �kisajátítják� a pontokat, hiszenmivel nem vezet ki bel®lük él, a sajátrangjukat nem osztják meg egyetlenoldallal sem. Az 5.2 ábrán láthatunkegy példát erre az esetre, ahol P3-bólegyetlen él sem megy ki.

Az el®z®, azaz az 5.1 ábra istartalmaz egy hasonló esetet: a P4,P5 és P6 oldalak egy olyan halmaztalkotnak, ahonnan nem vezet ki él, így akezdeti π(0)T vektor az (5.3) egyenletetalkalmazva már a 10. iteráció után a következ®képpen néz ki: π(10)T =(0 0 0 2/15 4/15 1/5

). Az els® három oldal rangja tehát nullára

csökkent, pedig a cél az lenne, hogy minden weboldal egy pozitív ranggalrendelkezzen.

P1 P2

5.3. ábra

Egy másik komoly problémát a ciklusokjelentenek. Nézzük az 5.3 ábrán látható egyszer¶példát, ahol a P1 és P2 oldalak csak egymásrahivatkoznak. Ennek a gráfnak a H mátrixa akövetkez®:

H =

(0 11 0

)Ekkor ha az (5.3) egyenletet a π(0)T =

(1 0

)kezdeti vektorra alkalmazzuk, az iteráció nem fog konvergálni, ugyanis π(k)T

mindig az(1 0

)vagy a

(0 1

)vektor lesz, attól függ®en, hogy k páros vagy

páratlan.

50

Page 51: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

5.4. Kapcsolat a Markov-láncokkal

Az (5.3) egyenletre tulajdonképpen úgy is tekinthetünk, hogy ez ahatvány iteráció alkalmazása egy Markov-lánc esetén, amelynek az átmenetivalószín¶ségi mátrixa H. Ez egy fontos észrevétel, ugyanis ahogy márkorábban láthattuk, a Perron�Frobenius tétel jól alkalmazható a Markov-láncok körében, és így a PageRank algoritmusban is fontos szerepe van.

Ha P egy olyan Markov mátrix, amely sztochasztikus, irreducibilis ésaperiodikus, akkor tudjuk, hogy tetsz®leges kezd®vektor esetén a hatványmódszer konvergál egy pozitív vektorhoz, amely egyértelm¶, ez astacionárius vektor. Így tehát a PageRank algoritmus már korábban említettkonvergencia problémáira (csúcsok kimen® élek nélkül, illetve ciklusok)könnyen találhatunk megoldást, ha a H mátrixot úgy módosítjuk, hogy egyMarkov mátrix legyen amely rendelkezik az el®bbi három tulajdonsággal. Eza végs® mátrix lesz az úgynevezett Google mátrix.

Összefoglalva tehát a Perron�Frobenius tétel alapján egyértelm¶enlétezik egy pozitív PageRank vektor, amennyiben a Google mátrixsztochasztikus és irreducibilis. Továbbá, ha a mátrix aperiodikus, akkor ahatvány iteráció tetsz®leges kezd®vektor esetén konvergál ehhez a PageRankvektorhoz.

5.5. A Google mátrix felépítése

Brin és Page eredetileg nem hozták összefüggésbe az algoritmusukat aMarkov-láncokkal, hanem egy �random surfer � nev¶ fogalmat használtak,ami egy olyan embert jelképez, aki véletlenszer¶en böngészi az internetet,mégpedig úgy, hogy követi a hivatkozásokat. Tehát ha egy A weboldaltöbb oldalra is hivatkozik, akkor az internetez® kiválaszt egy véletlen oldaltezek közül, így eljut egy B honlapra, majd ezt a folyamatot folytatva,megnézi, hogy B milyen oldalakra hivatkozik, és azok közül is választegyet véletlenszer¶en, és így halad tovább. Így azonban hamar egy olyanproblémába ütközhet, amelyet korábban már említettünk: ha egy olyanoldalra jut, amely nem hivatkozik sehová sem (például egy pdf fájl).

Az ilyen oldalaknak a H mátrixban a csupa nulla sorok felelnek meg,így ezt a problémát úgy lehet megoldani, ha ezeket a sorokat lecseréljükcsupa 1/n-b®l álló sorokra. Ezzel kapunk egy S mátrixot, amely mársztochasztikus, és így az internetez® egy ilyen linkre érkezve egyenl®valószín¶séggel bármelyik másik oldalra tovább haladhat. Ezt matematikailag

51

Page 52: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

a következ®képpen írhatjuk fel: S = H + a( 1neT ), ahol e a csupa 1-esekb®l

álló vektor, a pedig egy olyan vektor, amelyre ai = 1, ha az i-edik oldalbólnem vezet ki él, különben 0. Így például az 5.1 ábrához tartozó S mátrix akövetkez®képpen néz ki:

S =

0 1/2 1/2 0 0 01/6 1/6 1/6 1/6 1/6 1/61/3 1/3 0 1/3 0 00 0 0 0 1/2 1/20 0 0 1/2 0 1/20 0 0 0 1 0

Ha a weboldalak és a hivatkozások gráfos reprezentációjára gondolunk,

ez a megoldás annak felel meg, mintha minden olyan pontba, amelyb®l nemvezet ki él, behúznánk egy-egy kimen® élt a gráf összes csúcsába, ami ebbenaz esetben így nézne ki:

P3

P1 P4

P2 P5

P6

5.4. ábra. Az S mátrix gráfos ábrázolása.Az újonnan behúzott éleket piros szín jelöli.

Most azt szeretnénk, hogy a mátrix primitív is legyen, ami Markov-láncok esetén azt jelenti, hogy a stacionárius vektor (ami jelen esetben aPageRank vektor) egyértelm¶en létezik, és könnyen kiszámítható a hatványmódszerrel. Brin és Page a random surfer segítségével ezt úgy fogalmaztákmeg, hogy bár az internetez® követi a hivatkozások struktúráját, de néhameggondolja magát, és függetlenül attól, hogy épp melyik oldalon van és

52

Page 53: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

az mely oldalakra hivatkozik, beír a böngész® URL sávjába egy tetsz®legesweboldalt, és onnan böngészik tovább.

Ahhoz, hogy ezeket a véletlen ugrásokat matematikailag leírjuk, akövetkez® mátrixot vezetjük be:

G = αS + (1− α) 1neeT

Itt α ∈ ]0, 1[, e pedig a csupa 1-esekb®l álló vektor, és ezt a G mátrixotnevezzük Google mátrixnak. Az α paraméter azt modellezi, hogy azinternetez® mennyi id®t töltött a hivatkozások struktúrájának követésével,és mennyit az oldalak közti ugrásokkal. Például α = 0, 7 azt jelenti, hogya böngészéssel töltött id® 70%-ában úgy jutott el egy A oldalból B-be,hogy A hivatkozott B-re, és így rákattintott, az id® 30%-ában pedig beírt aböngész®jébe egy tetsz®leges weboldalt. Az ilyen utóbbi ugrások valóbanvéletlenszer¶ek, ugyanis az ezeknek megfelel® E = 1

neeT mátrixnak minden

eleme 1n-nel egyenl®, tehát az internetez® valóban egyforma valószín¶séggel

jut bármelyik oldalra az egyes ugrások során.

5.5.1. A mátrix tulajdonságai

Az alábbiakban láthatjuk összefoglalva, hogy a felépített G Googlemátrix milyen tulajdonságokkal rendelkezik.

• G sztochasztikus, mivel konvex kombinációja két sztochasztikusmátrixnak, S-nek és E = 1

neeT -nak.

• G irreducibilis, ugyanis az E mátrix által minden oldal közvetlenülössze van kötve az összes többi oldallal, és így szükségképpen teljesülaz irreducibilitás.

• G aperiodikus, ez következik abból, hogy minden i-re Gii > 0.

• G primitív, hiszen már k = 1 esetén teljesül, hogy Gk > 0. Ebb®lkövetkezik az, hogy egyértelm¶en létezik egy pozitív πT PageRankvektor, és hogy G-re alkalmazva a hatvány iteráció ehhez a vektorhozkonvergál.

• G s¶r¶ abban az értelemben, hogy az elemeinek a nagy rész nem nulla,ez pedig a számítások szempontjából kifejezetten el®nytelen. Azonbanki tudjuk fejezni G-t úgy, hogy csak az eredeti H mátrixunk szerepelaz egyenletben, és ezáltal H-val már könnyen tudunk számolni:

53

Page 54: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

G = αS + (1− α) 1neeT

= α

(H +

1

naeT)+ (1− α) 1

neeT

= αH + (αa+ (1− α)e) 1neT (5.4)

A Google mátrix elég mesterséges abból a szempontból, hogy azeredeti H mátrixot kétszer is módosítottuk ahhoz, hogy végül egy olyanmátrixot kapjunk, amelyre teljesülnek a konvergenciához szükséges feltételek.Ugyanakkor ezen módosítások nélkül nem tudnánk kiszámolni a rangsort,hiszen a H mátrixhoz nem létezik stacionárius vektor, viszont G-hez igen, ésaz így kapott PageRank vektor jól mutatja az egyes weboldalak fontosságát.

5.6. A PageRank vektor kiszámítása

Összefoglalva, a Google PageRank algoritmusa az alábbi iterációból áll:

π(k+1)T = π(k)TG (5.5)

Ez tulajdonképpen a hatvány módszer G-re alkalmazva. Így a PageRankvektor kiszámítása az alábbi sajátérték problémával írható fel:

πT = πTG

πT e = 1

Ha ezt transzponáljuk, akkor a Perron�Frobenius tételben szerepl® alakbanláthatjuk a feladatot:

GTπ = π

eTπ = 1

A Perron tétel (2.0.1 Tétel) pont erre vonatkozik: G egy pozitív mátrix,tehát alkalmazható rá a tétel, és mivel G sztochasztikus, így a legnagyobbsajátértéke 1, tehát a tétel (2.5) pontja alapján egyértelm¶en létezik egy ilyenpozitív π vektor.

A PageRank vektor kiszámításához célszer¶ G-t az (5.4) egyenletsegítségével felírni, mert így csak a H-t kell használnunk a számítások során.

54

Page 55: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

Ez azért hasznos, mert H egy ritka mátrix, így sokkal könnyebb tárolni is ésszámolni vele. Így az (5.5) egyenlet a következ®képpen írható át:

π(k+1)T = π(k)TG

= απ(k)TS +1− αn

π(k)T eeT

= απ(k)TH +(απ(k)Ta+ 1− α

) 1neT (5.6)

Most nézzük meg, hogy az 5.1 ábrán látható 6 weboldalnál mi is lesza végs® rangsor, azaz számoljuk ki a hozzá tartozó Google mátrixot, majda PageRank vektort az (5.6) egyenlet segítségével. Ehhez el kell döntenünk,hogy milyen α paraméterrel dolgozzunk. Brin és Page eredetileg α = 0, 85-telszámoltak, és végül a Google keres® is ezt a számot használja. Ennek az azoka, hogy α50 = 0, 8550 ≈ 0, 000296, ami azt jelenti, hogy már az 50. iterációután körülbelül 2-3 tizedesjegy pontossággal megadható a PageRank vektor.Ez a pontosság pedig elegend® egy jó rangsor felállításához, tehát legyen ami esetünkben is α = 0, 85, és ekkor az 5.1 ábrához tartozó Google mátrix akövetkez®:

G = 0, 85H + (0, 85

010000

+ 0, 15

111111

)1

6

(1 1 1 1 1 1

)

=

1/40 9/20 9/20 1/40 1/40 1/401/6 1/6 1/6 1/6 1/6 1/6

37/120 37/120 1/40 37/120 1/40 1/401/40 1/40 1/40 1/40 9/20 9/201/40 1/40 1/40 9/20 1/40 9/201/40 1/40 1/40 1/40 7/8 1/40

A hozzá tartozó PageRank vektor pedig a következ®:

πT =( P1 P2 P3 P4 P5 P6

0, 0365 0, 0520 0, 0405 0, 1410 0, 2460 0, 1895)

55

Page 56: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

5. FEJEZET. GOOGLE PAGERANK

Ennek a vektornak az i-edik koordinátája megmondja, hogy az internetez®mennyi id®t töltött a Pi oldal látogatásával, például a P3 honlapot azid® 4,05%-ában látogatta meg. Ezek alapján a rangsort felírhatjuk a(P5 P6 P4 P2 P3 P1

)vektorral, ami azt jelenti, hogy P5 a legnagyobb

ranggal rendelkez® weboldal, P1 pedig a legkisebbel.

56

Page 57: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

6. fejezet

Általánosítás végtelendimenzióban

A korábbi fejezetekben láthattuk, hogy véges dimenzióban aPerron�Frobenius tételkört számos helyen lehet alkalmazni, pozitív ésnemnegatív mátrixok esetén egyaránt. Ebben a fejezetben arról olvashatunk,hogy hogyan lehetne a tételt általánosítani végtelen dimenziós esetre.

A véges dimenziós mátrixoknak a végtelen dimenzióban a korlátoslineáris operátorok felelnek meg (például a Banach-terek felett). Egy operátorsajátértékét a mátrixok sajátértékéhez hasonlóan de�niáljuk, azonban azoperátor spektruma nem a sajátértékeinek, hanem a szinguláris értékeineka halmaza. Ezek minden Banach tér esetében értelmezhet®k, a pozitivitásviszont csak bizonyos esetekben. Például Lp terekben, ahol a pozitivitása pontonkénti kiértékelésekb®l örökíthet®, azaz egy f ∈ Lp függvénypozitív, ha f ≥ 0 majdnem mindenütt. Vegyük észre, hogy amit aBanach-terek kontextusában pozitivitásnak nevezünk, az tulajdonképpenvéges dimenzióban a nemnegativitásnak felel meg. Ilyenkor tehát egy Toperátort akkor mondunk pozitívnak, ha a pozitív elemeknek az operátoráltal megadott képei is pozitívak, vagyis f ≥ 0⇒ T (f) ≥ 0.

Az ilyen, pozitivitás fogalommal ellátott Banach-tereket Banach-hálóknak nevezzük. Ekkor a Perron�Frobenius tételnek megfelel®en akövetkez® tétel mondható ki.

6.0.1. Tétel. Legyen T : B −→ B pozitív lineáris operátor, ahol B tetsz®leges

Banach-háló. Jelölje T spektrumát σ(T ) és legyen r(T ) = limk→∞

∥∥T k∥∥1/k.Ekkor r(T ) ∈ σ(T ).

57

Page 58: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

6. FEJEZET. ÁLTALÁNOSÍTÁS VÉGTELEN DIMENZIÓBAN

Továbbá, ha feltesszük, hogy létezik olyan M > 0 konstans, amelyreminden n ∈ N esetén teljesül, hogy ‖T n‖ < Mr(T )n, akkor:

r(T )eiϕ ∈ σ(T ) =⇒ r(T )einϕ ∈ σ(T ) ∀n ∈ Z.

A Perron�Frobenius tétel általánosítása fontos szerepet tölt be adi�erenciálegyenletek témakörében. Azt mondjuk, hogy egy (T (t))t≥0operátorcsalád er®sen folytonos, ha az adott Banach-tér minden x eleméreteljesül, hogy bármely t0 esetén lim

t→t0‖T (t)x− T (t0)x‖ = 0 (ekkor a vizsgált

norma a Banach-tér normáját jelenti). Parciális di�erenciálegyenletek eseténha egy x kezdeti feltétel mellett T (t)x adja meg a megoldást a t id®pontban,akkor általában teljesül az er®sen folytonosság feltétele. Így ez a feltételteljesül például a h®vezetési egyenletre is.

Ha (T (t))t≥0 egy olyan er®sen folytonos operátorcsalád, amelyre T (0) =I, és bármely nemnegatív t1 és t2 esetén T (t1 + t2) = T (t1)T (t2), akkor aztmondjuk, hogy (T (t))t≥0 egy C0-félcsoport. Ez szemléletesen azt jelenti, hogyha például vizsgáljuk egy szoba h®mérsékletét (például t1 = 1 és t2 = 2 percelteltével), akkor a szoba h®mérséklete a 0. pillanathoz képest 1 + 2 percmúlva ugyanannyi lesz, mintha a kezdethez képest külön vizsgáltuk volna1 majd újabb 2 perc elteltével. (Tehát a vizsgált id® szétbontása nemmódosított az eredményen.)

Vezessük be aD(A) jelölést azon kezdeti feltételek halmazára, amelyekredi�erenciálható módon változik a megoldás:

D(A) =

{x ∈ X : ∃ lim

t→0+

T (t)x− xt

}Ez a halmaz általában megegyezik a klasszikus kezdeti feltételekkel. Ha Aegy olyan operátor, amely D(A)-ból képez az X Banach-térbe úgy, hogy Axmegegyezik a D(A) halmazt meghatározó határértékkel, akkor szemléletesenAx azt mutatja, hogy mi lesz T (t)x deriváltja a 0-ban:

Ax(t) = ∂tx(t) =⇒ x(t) = T (t)x(0)

Ugyanakkor, ha tekintjük véges dimenzióban az Ax(t) = ∂tx(t) di�erenciál-egyenlet-rendszert, ahol A egy négyzetes mátrix, akkor tudjuk, hogy annakmegoldása felírható x(t) = eAtx(0) alakban. Ha ehhez hozzávesszük az el®z®egyenletet, akkor azt kapjuk, hogy T (t) = eAt. Ez azt jelenti, hogy ez a T (t)operátor félcsoport általánosítja a véges dimenziós eAt hatványt.

Így végül operátor-félcsoportokra is kimondható egy tétel, amely aPerron�Frobenius tételt általánosítja.

58

Page 59: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

6. FEJEZET. ÁLTALÁNOSÍTÁS VÉGTELEN DIMENZIÓBAN

6.0.2. Tétel. Legyen (T (t))t≥0 egy pozitív C0-félcsoport az X Banach-hálófelett. Ekkor s(A) := sup {Reλ : λ ∈ σ(A)} ∈ σ(A).

Továbbá, ha feltesszük, hogy létezik olyan M > 0 konstans, hogy mindent ≥ 0 esetén ‖T (t)‖ < Mes(A)t, akkor:

s(A) + iβ ∈ σ(A) =⇒ s(A) + inβ ∈ σ(A) ∀n ∈ Z.

59

Page 60: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

Irodalomjegyzék

[1] Carl D. Meyer, Matrix Analysis and Applied Linear Algebra, SIAM, 2000.

[2] Roger A. Horn, Charles R. Johnson, Matrix Analysis, Cambridgeuniversity press, 2013.

[3] Peter D. Lax, Linear Algebra and Its Applications, Wiley-interscience,2007.

[4] Thomas L. Saaty, Rank According to Perron: A New Insight, Universityof Pittsburgh.https://galton.uchicago.edu/~lekheng/meetings/mathofranking/

ref/saaty.pdf

[5] Shlomo Sternberg, The Perron�Frobenius theorem, Harvard University.http://www.math.harvard.edu/library/sternberg/slides/

1180912pf.pdf

[6] Hannah Cairns, A short proof of Perron's theorem, 2014.http://www.math.cornell.edu/~web6720/Perron-Frobenius_

Hannah%20Cairns.pdf

[7] Bakonyi Eszter, Nemnegatív mátrixok szakdolgozat, 2014.https://www.cs.elte.hu/blobs/diplomamunkak/bsc_matelem/2014/

bakonyi_eszter.pdf

[8] Lukács Erzsébet, Alkalmazott algebra el®adás jegyzet, 2015.http://math.bme.hu/~lukacs/bboard/alkalg/2015/ea12_15aa.pdf

[9] Bogya Norbert, Leontief-féle input-output modell.http://www.math.u-szeged.hu/~nbogya/linalgk1011II/leontief.

pdf

60

Page 61: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

IRODALOMJEGYZÉK

[10] Leslie-modell, ELTE biológia alapszak 2008/09 1. féléves matematikagyakorlat jegyzet.http://people.inf.elte.hu/pazqaat/Matek/gy1002.pdf

[11] Csiszár Vill®, Diszkrét és folytonos paraméter¶ Markov láncok.http://www.cs.elte.hu/~villo/ml/ML.pdf

[12] Böjthy Barbara Adrienn, Sztochasztikus mátrixok és Markov-láncokszakdolgozat, 2013.https://www.cs.elte.hu/blobs/diplomamunkak/bsc_matelem/2013/

bojthy_barbara_adrienn.pdf

[13] Amy N. Langville, Carl D. Meyer, Google's PageRank and Beyond: TheScience of Search Engine Rankings, Princeton University Press.http://geza.kzoo.edu/~erdi/patent/langvillebook.pdf

[14] Jochen Glück, Positive Semigroups and Perron Frobenius Theory, UlmUniversity, 2013.https://www.uni-ulm.de/fileadmin/website_uni_ulm/mawi.inst.

020/glueck/Dateien_fuer_Homepage/Vortragsfolien/J_Glueck_

Perron_Frobenius_Theory.pdf

[15] Adam Kanigowski, Wojciech Kryszewski, Perron-Frobenius and Krein-Rutman theorems for tangentially positive operators Central EuropeanJournal of Mathematics, 2012.

61

Page 62: Maros Alexandra - Eötvös Loránd University...1. fejezet Algebrai összefoglaló Ebben a fejezetben tisztázzuk azokat az algebrai fogalmakat, illetve jelöléseiket, amelyeket a

Nyilatkozat

Név: Maros AlexandraELTE Természettudományi Kar, szak: matematika BSc.NEPTUN azonosító: N9T3HSSzakdolgozat címe: Perron�Frobenius tételkör és alkalmazásai

A szakdolgozat szerz®jeként fegyelmi felel®sségem tudatában kijelen-tem, hogy a dolgozatom önálló munkám eredménye, saját szellemi termékem,abban a hivatkozások és idézések standard szabályait következetesen alkal-maztam, mások által írt részeket a megfelel® idézés nélkül nem használtamfel.

Budapest, 2016. május 27.

a hallgató aláírása